0 Вступительное слово
Семантическая алгебра – это аналитическая дисциплина о значении слов их признаках и отношениях. Началом её развития можно считать 2005 г. Она является продолжением таких наук как: логика, диалектика и информатика.
Сейчас в мире полно сложных информационных систем. В них надо уметь разобраться, выделить главное. Семантическая алгебра побеждает сложность. Как это работает?
Поставьте на листе бумаги 8 точек в произвольном расположении. Теперь соедините их все отрезками так, чтобы каждая точка имела только 3 отрезка. Что получилось?
Топологически это скорее всего - куб, хотя он выглядит довольно сложно, по сравнению с обычным кубом. Так вот семантическая алгебра позволяет строить модели знаний или систем в простой, ортогональной, канонической форме.
На практике это имеет огромный потенциал для тензорных классификаторов, для разбора и анализа текста, для управления программированием нейросетей по отобранным лингвистическим корпусам, для разработки систем машинного перевода, для генерации сценариев игр-путешествий, для обработки обращений клиентов, и для решения многих таких задач, которые появятся в будущем.
Предлагаемые фрагменты – это отобранные части монографии «Семантическая алгебра», которая развивается более 10 лет и имеет 84 редакции. Эти фрагменты распределены на 4 уровня сложности:
1. Начальный уровень содержит общие сведения о теме и ряд уроков с примерами, цель которых – установить порядок с теми знаниями, которые мы получали в школе и институте.
2. Средний уровень содержит основные детали семантической алгебры, систему семантических отношений, понятие о семантических тензорах, приёмы построения семантических моделей.
3. Высший уровень содержит фундаментальные знания аналитической семантики, разбор близких философских и теологических вопросов, ряд гипотез, которые ещё требуют доказательства и проверок.
4. Прикладной уровень содержит примеры применения аналитической семантики в различных областях знаний, таких как биология, психология, литература, теория управления и т.п.
По мере возможности, я постараюсь регулярно пополнять этот материал новыми сведениями с примерами.
Владимир Евгеньевич Липатов
woldemar1974lve@yandex.ru
03.2023, Балашиха
Облако проекта - https://yadi.sk/d/ZwxcckRGtZ5o6
Начальный уровень
1 Что такое Семантическая Алгебра и почему она так называется Начальный уровень
Прежде всего, семантика - это наука о значении слов.
Сегодня она подразделяется на:
1. Лингвистическую семантику, которая изучает влияние частей слов на смысл.
2. Компьютерную семантику, которая позволяет интерпретировать и переводить выражения, а также отвечать на запросы.
3. Нейросетевую семантику - для решения нетривиальных задач.
4. Аналитическую семантику - которая изучает отношения между понятиями и их признаки. Это и есть Семантическая алгебра.
Семантическая алгебра имеет несколько сходств с математической алгеброй. Дело в том, что слова хранят в себе сразу несколько простых понятий, точно также как числа хранят свои простые множители.
Например:
Слово - "девочка" - хранит признаки ребёнка женского пола.
Точно также число 6 хранит множители 2 и 3 как простые числа.
Слова выступают как признаки, при образовании других слов. Это можно обозначить значком умножения:
Женщина * Дом = Хозяйка.
Мужчина * Работа = Рабочий.
Рабочий * Опыт = Мастер.
Запасы * Здание = Склад.
Полка * Полка = Стеллаж.
Таким образом, по признакам можно объединять слова в семантические вектора и матрицы. Это похоже на линейную алгебру.
Что получится, если семантически перемножить:
Мужчина, Женщина * Детство, Юношество, Зрелость, Старость.
Получается:
Мальчик, Юноша, Мужчина, Старик,
Девочка, Девушка, Женщина, Старуха.
2 История становления Семантической алгебры Начальный уровень
С древних времён люди старались понять устройство мироздания. Были попытки объяснить это через мифические существа, через стихии. Однако наиболее интересным был тезис о Логосе. О том что мироздание устроено посредством СЛОВА. Этот тезис породил теологическое направление (богословие) и философию.
Затем большой вклад внёс Аристотель, как основоположник формальной логики.
Следующим этапом была работа Фридриха Гегеля «Наука Логики». Были введены понятия о дихотомиях, стала развиваться диалектика (рекомендую работу Георгия Челпанова «Учебник Логики»).
Стали разрабатываться толковые словари. Появилось понятие о семантике слова. Чарльз Осгуд ввёл понятие о семантическом пространстве.
Затем стали развиваться компьютерные языки программирования, бинарная логика, объектно ориентированное программирование и т.п. технологии. Они дали множество новых понятий и операций.
В 2005г. Учёный из Хабаровска Станислав Тактаев вводит понятие Семантическая Алгебра. Он предлагает ряд операций в семантическом пространстве используя аппарат векторной алгебры.
Независимо от него математик Григорий Рейнин, занимаясь соционикой, проводит ряд интересных операций с признаками и понятиями, которые легли в основу современной семантической алгебры.
Монография Семантическая Алгебра – стала активно разрабатываться с 2010 года. За 10 лет она претерпела более 80 редакций и дополнений.
Были сформулированы аксиомы и теоремы, была введена система семантических отношений, операции семантического сложения и умножения, понятие о семантическом тензоре и множество примеров построения семантических моделей.
3 УРОК ВВОДНЫЙ, ПРО АНТОНИМЫ Начальный уровень
В современном мире нас окружают большие потоки информации.
Чтобы в них ориентироваться - нужны методы анализа текста.
Семантическая алгебра - это фундаментальный подход к работе со смыслами и понятиями языка. Он основан на бинарной комбинаторике, линейной алгебре, на методе подбора семантических ассоциаций и на объектно-ориентированном моделировании.
Семантическая алгебра - это не только базис для новых информационных технологий, это определённая культура мышления.
Известно, что в языке есть слова синонимы и антонимы. Синонимы мы пока оставим в покое. Давайте поговорим о роли антонимов.
Мы знаем, что в языке бывают просто слова, а бывают слова парные, как «верх - низ», «мужчина - женщина», «чёрное - белое».
Их называют антонимами, потому что они противоположны друг другу по смыслу. Антонимы играют важнейшую роль в образовании новых слов. Если есть основная пара противоположностей, то они могут выступать в качестве признаков в других словах.
Например, понятие пола: «мужчина - женщина», определяет окончание большой группы слов: «школьник - школьница», «учитель - учительница», «работник - работница». Видите, как одно слово указывает сразу на два признака: на профессию и на половую принадлежность.
Другой пример. Такие понятия, как: «верх - низ», имеют приставки «над- и под-». В словах «надводный - подводный», сразу указывается признак среды и признак вертикального расположения.
Это очень удобно.
Или так: «надгробие», «подставка». Парный признак не всегда порождает парные понятия.
Вопрос: может ли одно понятие породить новое понятие самостоятельно? И если да, то приведите пример.
4 УРОК ПРО УМНОЖЕНИЕ ПРИЗНАКОВ Начальный уровень
Многим известно понятие ассоциации. Это когда одно понятие вызывает массу связанных образов. Например, слово «дом», вызывает такие образы, как: «кухня», «кровать», «строение», «семья» и т.д. Обратите внимание, что слова «строение» и «семья», являются здесь определяющими признаками.
Можно записать такое выражение:
«Дом = Строение * Семья». Здесь значком умножение мы записали операцию объединения признаков. Таким же способом можно записать:
«Склад = Строение * Запасы».
Помните про роль частей слова на прошлом уроке? Вспомним примеры и запишем их с помощью умножения:
«Надводный = Верх * Вода»,
«Подставка = Низ * Стоять».
Таким образом, одни слова играют роль признаков при образовании других слов. А операцию объединения признаков назовём семантическим умножением.
Теперь разберём вопрос прошлого урока: «Может ли одно понятие породить новое понятие самостоятельно?»
Ответ: Да, может, если применить операцию семантического умножения. Например:
«Точка * Точка = Отрезок»,
«Полка * Полка = Шкаф».
Вот ещё интересный пример. Некоторые слова можно умножать на числа! Например: «3 * угол = треугольник».
Задание: если слова можно семантически умножать, то можно ли и как их семантически делить?
5 УРОК О ТИПАХ АНТОНИМОВ Начальный уровень
Разберём задание прошлого урока: «Если слова можно семантически умножать, то можно ли и как их семантически делить?»
Делить слова можно, но далеко не всякие, только если семантическое уравнение составлено корректно. Для этого надо иметь под рукой хороший толковый словарь. Читаем определение слова, точнее понятия, и выделяем его определяющие признаки. Это будет разложением слова на семантические множители. Делитель должен быть среди этих признаков. Здесь используется полная аналогия с целочисленной арифметикой. Как в составном числе простые множители сохраняются как информационные единицы, также и в производном понятии сохраняются его признаки.
Вернёмся к антонимам. Можно ли все антонимы разделить на какие-то группы?
Да. Антонимы можно разделить на несколько групп. Для начала рассмотрим следующие три группы: качественные, противоположные и сравнительные.
1.Качественные антонимы. Это похоже на отношение 0 и 1 в арифметике. 0 – это пустота, 1 – это наличие. Например: «покой - движение», «тишина - звук». Важно то, что одно понятие не несёт никаких качеств, а понятие парное имеет целый спектр характеристик и свойств. Например, понятие «движение» имеет свойства направление и скорость. Понятие «звук», имеет свойства громкость и тональность.
2.Противоположные антонимы. В отличии от качественных антонимов, эти антонимы равноправны, но полностью противоположны. Это похоже на пары положительных и отрицательных чисел. Например: «левое - правое», «верх - низ», «чёрное - белое» и т.д.
Обратите внимание, что в таких парах одно понятие несёт позитивную, а другое – негативную эмоциональную окраску. Например: «правое, верх и белое» имеет позитивную окраску.
3.Сравнительные антонимы. Такие антонимы означают явно разную степень, силу, интенсивность чего-либо. Например: «много > мало», «сильно > слабо», «ярко > тускло». Здесь использован значок сравнения, чтобы показать характер и направление этих пар.
Обратите внимание, что мы имеем почти полный семантический аналог арифметического аппарата. У нас есть 0 и 1, есть положительные и отрицательные величины, и есть средства сравнения. Ранее были определены операции семантического умножения и деления.
Теперь, когда мы знаем, что антонимы могут быть разных типов, то надо задать вопрос: «Можно ли из слов создавать не только пары, но и квадраты или даже кубы?». Если да, то приведите примеры. Это задание на следующий урок.
Средний уровень
6 УРОК О СЕМАНТИЧЕСКИХ ТЕНЗОРАХ Средний уровень
На прошлом уроке мы поставили вопрос: «Можно ли из слов создавать не только пары, но и квадраты или даже кубы?»
Да, можно. Вот интересные примеры:
1. «Цифра - Число»,
2. «Буква - Слово»;
1. «Истина - Ложь»,
2. «Правда - Вымысел».
А вот пример куба:
1. Храбрый - Трусливый,
2. Богатый - Бедный,
3. Сильный - Слабый,
4. Умный - Глупый,
Как видно из этих примеров, мы использовали более разнообразные отношения, чем говорили об этом ранее. Дело в том, что существует 8-мь типов семантических отношений. Об этом будет сказано на следующем уроке.
Обратим внимание на то, что мы получили новые объекты для изучения. Геометрически они похожи на квадраты и кубы. Записывать их удобно в виде таблиц. Однако они обладают инвариантностью. Это значит, что перекатывание таких квадратов и кубиков с боку на бок, не изменит их сути.
В математике есть раздел – линейная алгебра. Он посвящён изучению таких объектов. Пары называют вектор. Квадраты называют матрицами. А общее название – тензоры. Тензоры – это многомерные объекты. Их размерность называют рангом.
Если ранг=0, то это скаляр, как одно слово.
Если ранг=1, то это вектор, как пара слов (бислово).
Если ранг=2, то это матрица, как квадрат слов (квадрослово).
Если ранг=3 и более, то это тензор.
Общее название таких объектов в семантической алгебре – семантический тензор.
Семантические тензоры можно перемножать. Это соответствует перемножению групп признаков. Вот примеры для матриц:
Что получится, если перемножить вектор возраста на пол и семейность?
(детство, юношество, взрослость, старость) * (мужчина, женщина) * (гражданское, семейное) =
1. Ребёнок, Юноша, Мужчина, Старик,
2. Девочка, Девушка, Женщина, Старуха,
3. Внук, Сын, Отец, Дедушка,
4. Внучка, Дочка, Мать, Бабушка.
Рекомендация: Поупражняйтесь в составлении семантических матриц.
7 УРОК ПРО 8-МЬ ТИПОВ ОТНОШЕНИЙ Средний уровень
Теперь пора вспомнить о типах отношений. Отношения или связи слов в семантических тензорах основаны на симметрии разного рода. Рассмотрим эти типы отношений (в скобках дано обозначение):
1. КАЧЕСТВО (+). Это означает появление качества, образование смысловой оси. Примеры: «Покой + Движение», «Тишина + Звук», «Темнота + Свет», «Точка + Прямая + Плоскость + Пространство». Там где «Отсутствие», там качества нет или его мало. Там где «Наличие» – качество проявляется в большем спектре и многообразии. Для «движения» - это направление и скорость. Для «звука» - это громкость, продолжительность и тональность.
2. ВАРИАЦИЯ (&). Это разновидность. Пара однородных и равноранговых слов. Например: «Озеро & Пруд», «Листва & Хвоя», «Стол & Стул», «Собака & Кошка», «Ложка & Вилка», «Товар & Услуга».
3. ПОЛЯРНОСТЬ (-). Это зеркальная антисимметрия, противоположность, компенсация. Здесь неявно фигурирует эмоциональная оценка. Например: «Чёрное – Белое», «Верх – Низ», «Левое - Правое», «Горячее – Холодное», «Позитивное - Негативное», «Положительное - Отрицательное», «Способность - Потребность».
4. СРАВНЕНИЕ (> или <). Это градация. Пара слов обозначает интенсивность, силу, степень или превосходство. Здесь тоже присутствует эмоциональная оценка. Например: «Много > Мало», «Сильно > Слабо», «Ярко > Тускло», «Кресло > Стул > Табурет», «Громадный > Большой > Маленький», «Очень > Чуть».
5. ДОПОЛНЕНИЕ (#). Это ортогональность. Пары слов дополняют друг друга до появления смысловой плоскости. Одно предназначено для другого. Например: «Форма # Содержание», «Причина # Следствие», «Мужчина # Женщина», «Вопрос # Ответ», «Задача # Решение», «Цель # Средства», «Процесс # Результат», «Свойство # Состояние».
6. УСТРОЙСТВО (%). Это агрегация. Пара слов типа «Часть % Целое». Например: «Квартира % Дом», «Буква % Слово», «Деталь % Устройство», «Ветка % Дерево».
7. ТРАНСГРЕССИЯ (\ или /). Пара означает асимметричную противоположность имеющую характер либо упадка и ущерба, либо восстановления и компенсации. Например: «Рождение \ Смерть», «Сигнал \ Помеха», «Постройка \ Развалины». Или, например: «Ущерб / Компенсация», «Поломка / Ремонт», «Болезнь / Лечение», «Ошибка / Исправление».
8. НАСЛЕДОВАНИЕ (^). Это отношение типа «Вид ^ Подвид» или «Абстрактное ^ Конкретное». Например: «Дорога ^ Улица», «Постройка ^ Здание», «Водоём ^ Озеро».
С другой точки зрения 8-мь отношений делятся на:
1. Абстрактные – Конкретные,
2. Абсолютные – Относительные,
3. Однородные - Структурные.
Однозначные отношения образуют пары, многозначные образуют множество вариантов. Общие отношения имеют общее характеризующее слово. Например: «Тишина + Звук» - акустика, «Верх - Низ» - вертикаль, «Озеро & Пруд» - водоём. Частные отношения не имеют такого общего характеризующего слова
Отредактировано Владимир Липатов (2023-03-05 16:58:49)