Scientific journal
Advances in current natural sciences
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,775

LANGUAGE OF INFORMATICS

Tsvetkov V.Y. 1
1 Moscow State Technical University of Radio Engineering
2733 KB
This article describes the language of computer science as a specific means of describing the world using information models and information technology. Vedeno concept design language. Introduced the concept of local semantic field . It is shown that the language of science is uneven and includes different language groups . Describes the information items as the basis of language science. Gives a method for estimating the complexity of information units on the basis of Kolmogorov. Described the structural and semantic complexity of information units. It is shown that the semantic content of linguistic structures depends on the shape and position of writing. Conducted meaningful comparison of information items used in text documents.
computer science
semantics
cognitive semantics
language constructs
information items
the complexity of information units
semantic complexity
the position information units
semantic levels of information units

Анализом языковых единиц занимается когнитивная семантика [1]. Однако она занимается исследованием преимущественно лексических единиц и естественных языков. Языковые конструкции естественного языка являются средством коммуникации и средством моделирования картины окружающего мира. Возникновение компьютерных языков оставалось за рамками исследований когнитивной семантики. Информатика первоначально появилась как наука об обработке информации. В ходе развития информатики и информационных технологий стали появляться формальные описания, которые можно рассматривать как аналоги языков. Наиболее наглядный пример – кодирование и криптография, которые имеют свои языковые средства. Когнитивная семантика предлагает модели языковой картины мира [2]: Эти модели могут быть разными для разных языков, но сопоставимыми по смыслу. Поэтому целесообразно использовать идеи когнитивной семантики для анализа языков информатики.

Языковые группы информатики. Многие науки имеют свой язык для передачи знаний. Информатика также имеет свой язык. Язык информатики выполняет три основные функции: описания, коммуникации, передачи смысла информационных сообщений. Язык информатики, в отличие от языков других наук, представляет собой совокупность различных языковых групп. Эти языковые группы формируются вследствие разных методов применения информатики: дескриптивная группа, семантическая группа, коммуникационная группа, процессуальная группа; формальная репрезентационная группа, визуальная репрезентационная группа, транзакционная группа, логическая группа.

Все группы имеют общее свойство – они являются средством описания. Различие между группами состоит в том, что в каждой группе применяют собственные терминологические конструкции.

Дескриптивная группа включает средства и языковые конструкции для отображения и описания окружающего мира. Семантическая группа включает средства для раскрытия смысла языковых конструкций. Коммуникационная группа включает языковые средства для описания процессов передачи информации. Процессуальная группа включает языковые средства для описания процессов обработки информации и связанных с этими процессами ситуаций и факторов.

Формальная репрезентационная группа включает языковые средства для представления результатов обработки информации в виде формул и выражений. Визуальная репрезентационная группа включает языковые средства представления результатов обработки информации в виде изображений, визуальных статистических и динамических моделей, моделей виртуальной реальности.

Транзакционная группа языка информатики включает средства для описания обмена данными при работе с базами данных и хранилищами. Логическая группа включает формальные языки логики, применяемые при анализе и выводе, а также для построении различных логических схем и правил.

С позиций системного анализа язык представляет собой сложную систему. Базой любого языка является алфавит. Алфавит языка – это совокупность элементов сложной системы. С позиций информатики алфавит языка представляет собой элементарные информационные единицы. Поэтому вполне логично введения для языка информатики понятия информационных единиц как элементов этого языка.

Информационные единицы. Информационные единицы можно рассматривать с разных аспектов. Информационные единицы, как элементы языка информатики, также образуют различные функциональные группы, соответствующие языковым группам: структурные информационные единицы, семантические информационные единицы, коммуникационные информационные единицы, репрезентационные информационные единицы, информационные единицы носителей информации. Разнообразие информационных единиц обусловлено разнообразием информационных технологий, в которых эти единицы применяют.

Информационные единицы, как средство описания мира, выделяют свойства, факты, процессы, отдельные ситуации, сценарии. Это дает основание разбить информационные единицы на категориальные группы: атрибутивные, процессуальные, субстанциональные и комбинированные.

Разделяют сложные и простые информационные единицы. Неделимые, по выбранному критерию информационные единицы образуют элементы [3], из которых строятся сложные информационные единицы. Каждая сложная информационная единица устанавливает свою смысловую связь между компонентами.

Информационная единица имеет определенный смысл, если существует ее интерпретация. Интерпретировать информационную единицу – это значит связать с ней семантическое окружение, т.е. конкретизировать локальную область, называемую также областью интерпретации. С точки зрения когнитивной семантики интерпретация может включать субъективные когнитивные процедуры [4].

Структурированность информационных единиц позволяет осуществлять их морфологический анализ. Морфологический анализ включает идентификацию формы информационной единицы (в простейшем случае словоформы) и приписывание форме соответствующего комплекса морфологической информации.

Информационные единицы разделяют на простые и сложные. Такое делений требует введения критерия сложности [5]. Необходимо разделять понятия сложности по структуре и по смыслу. Сложность по структуре можно проследить на примере иерархической структуры книги. Книга включает разделы и подразделы. Подраздел включает абзацы. Абзацы включают предложения. Предложения включают слова. Это типичная иерархическая структура.

Сложность по смыслу задается критерием смысловой делимости. Такими критериями могут быть сигнификативный смысл, предикативный смысл, контекст [6].

Смысловые различия информационных единиц. Между информационными единицами как единицами языка существует смысловое различие. Рассмотрим это различие на примере семантических информационных единиц: символ, слово, предложение, фраза [7] и структурной информационной единицы – символ.

Символ – информационная единица, обладающая неделимостью по структурному признаку. Символ, это атомарный объект на который может быть поделен фрагмент теста. Символ не имеет смыслового значения, а является информационным носителем информации. Символ имеет информационную емкость, выражаемую в битах.

Слово – информационная единица, обладающая неделимостью по сигнификативному смысловому признаку. В тексте слово – атомарная смысловая составляющая, отображающая объект. Слово соотносится с предметом отражения и указывает на него. Слово состоит из символов и имеет информационную емкость, выражаемую в битах.

Согласно Поланьи «слова несут в себе только ранее вложенное в них значение, и, и несмотря на то, что в предложении или во фразе их значение модифицированно, оно, как правило, не открывается впервые» [8].

Слово характеризуется возможностью изменения словоформы. Это влечет изменение смысла в предложении в определенных пределах. Поэтому смысл слова как независимого информационного объекта и смысл слова в предложении может различаться. Слово – сигнификативно неделимая информационная единица [9].

Предложение – информационная единица, обладающая неделимостью по предикативному смысловому признаку [7, 9]. Предложение – предикативно неделимая информационная единица. В отличие от слова для ряда предложений существует возможность проверки на истинность. Это возможно за счет использования свойства предикации. Предикация – отношение содержания сообщения к действительности, осуществляемая в предложении. Предложение имеет информационную емкость, выражаемую в битах.

Фраза – информационная единица, обладающая неделимостью по контекстному смысловому признаку [7, 9].. Фраза имеет информационную емкость, выражаемую в битах. Предложение в составе фразы может обладать свойством ассоциативности, т.е. соотносится по смыслу с другим предложением. Такое свойство приводит к появлению в предложении ассоциативных связей с другими предложениями или объектами. Это свойство наполняет фразу ассоциативным смысловым содержанием. Сообщение, содержащее фразы, может нести максимальную смысловую нагрузку. Информационные единицы, обладающие смыслом, называют семантическими информационными единицами. Основной смысловой информационной единицей является слово.

Однако слово может характеризоваться полисемией или неоднозначностью смысловых значений. Полисемия создает информационную неопределенность. Неопределенность устраняется путем формирования сложных информационных единиц и сложных языковых конструкций.

Языковые конструкции характеризуются зависимостью смысла от позиции информационных единиц. Семантическая сущность информационных единиц связана с наличием признаков релятивности, референциальности и ситуативности [10]. Например, изменение формы написания информационной единицы (курсив) означает референцию, то есть ссылку на ее подробное разъяснение.

Для информационных единиц существует понятие позиции, которое определяет их взаимное отношение. Выделяют следующие виды позиций: препозиция, интерпозиция и постпозиция. Позиция информационных единиц влияет на смысл сообщения. Например, «флажковый знак» в кодах переменной длины [11] занимает постпозицию и символизирует о конце информационной единицы – предложения.

Характерным представителем интерпозиции является семантическая информационная единица «and». В текстовых выражениях она связывает другие семантические единицы (слова, предложения). В логике выполняет функции оператора связывающего логические переменные [12]. Слово, стоящее в начале предложения, начинается с заглавного символа. Это признак препозиции.

Информатика ориентирована на компьютерную обработку, в которой широко используют Булеву алгебру и двоичные переменные. Это обстоятельство позволяет эффективно использовать я в языковых конструкциях дихотомические и оппозиционные переменные [13, 14]. Это накладывает специфику на язык информатики, в котором оппозиционные переменные анализируются со значительно большей легкостью, чем в естественном языке.

Выводы. Язык информатики включает совокупность языковых групп, что обусловлено наличием различных информационных технологий, в который этот язык применяется. Каждая языковая группа включает совокупность различных информационных единиц. Языковые группы разделяют по функциям или по категориям. Общим свойством всех групп является то, что простые единицы образуют сложные информационные единицы. Сложные информационные единицы образуют информационные сообщения. Позиция и форма написания информационных единиц влияет на смысл сообщения.