Информационный комплекс, который описывает лексику поэтических произведений великого татарского поэта («татарского Пушкина») Габдуллы Тукая (1886-1913), создан на основе разработанного в Казанском федеральном университете компьютерного фонда произведений Г. Тукая (автор проекта и руководитель работ -К.Р. Галиуллин).
Работы по созданию информационного комплекса поддержаны грантами Российского гуманитарного научного фонда, Российского фонда фундаментальных исследований, Федеральной программы «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 гг., Аналитической ведомственной целевой программы «Развитие научного потенциала высшей школы (2009-2010 гг.)» (2.2.1.1/6944) и др.
Основные компоненты комплекса:
1) традиционный (бумажный) словарь - Галиуллин К.Р., Каримуллина Р.Н. Габдулла Тукай: Язык поэзии: Словарь: в 2 кн. - Казань: Магариф, 2009. (1 кн. - 503 с.; 2 кн. - 527 с. - на русском и татарском языках).
2) интернет-словарь «Язык поэзии Габдуллы Тукая», расположенный на сайте «Казанский лингвографический фонд» портала Казанского федерального университета - httр://www.klf.ksu.ru/tukay (комментарии на русском и татарском языках).
Комплекс включает материалы всех стихотворений, вошедших в академические (научные) издания произведений Г. Тукая (411 стихотворений общим объёмом около 46 тысяч слов).
Макроструктуру традиционного словаря формируют конкорданс, обратный и частотный словоформоуказатели.
Конкорданс описывает все случаи употребления всех словоформ, зафиксированных в стихотворениях Г. Тукая и представляет собой полный алфавитно-частотный словоформоуказатель с контекстами (цитатами) в виде стихотворных строк. Отличительная особенность данного конкорданса (в сравнении, например, с конкордансом к стихотворениям А.С. Пушкина [Шоу Т. 2000]) - включение пояснений к словам ограниченного употребления (устаревшим, диалектным и др.), к собственным именам и некоторым заимствованиям. Структура словарной статьи конкорданса также предоставляет пользователю (читателю) возможность получить сведения о наличии / отсутствии искомой единицы в том или ином стихотворном произведении.
Обратный и частотный словоформоуказатели позволяют обеспечивать помимо традиционного входа в справочник (алфавитного прямого), также вход алфавитный инверсионный и по частоте.
Исследование тенденций развития словарного дела и информационного потенциала языковых справочников показывает, что наиболее перспективной формой существования словаря является интернет-версия, среди «плюсов» которой:
1) широкий круг пользователей; благодаря обогащению компьютерных технологий интернет-технологиями (что представляет собой очередную информационную революцию), достигается глобальная обобществленность материалов языковых словарей;
2) удобство эксплуатации;
3) многовходовость, возможность многопризнакового поиска;
4) возможности поддержки словаря в актуальном состоянии, постоянного развития, совершенствования (оперативная корректировка текста словаря, внесение необходимых дополнений и т.д.);
5) снятие многих ограничений на объем включаемого в словарь материала;
6) широкие возможности установления связи со сходными сетевыми справочниками и формирования лингвографических интернет-комплексов на основе ресурсов, размещенных как на одном, так и на разных порталах (сайтах).
В настоящее время интернет-компонент информационного комплекса предоставляет пользователю возможность отбора единиц (с получением соответствующих квантитативных данных): а) по условному образцу (в том числе и поиск с учетом позиции элемента в слове; например, поиск определенной финали, корневой части и др.); b) с учетом количества букв, знаков, а также частотных характеристик описываемых единиц.
Информационные технологии позволяют эффективно решать важную для характеристики языка текста проблему (на которую неоднократно указывали различные исследователи, составители авторских словарей) - исчерпывающая полнота представления текстовых материалов.
Интернет-компонент предоставляет возможность ознакомиться со всеми контекстами, содержащими запрашиваемую единицу; при этом пользователь может получить контекст разного объема - в виде одной строки, одной строфы или полного текста стихотворения.
Пользователь имеет такңе возможность определять объем обрабатываемой компьютерной текстотеки, при этом заказываемый текстовый массив может состоять из одного стихотворения, группы стихотворений или всей совокупности стихотворений.
В компьютерном фонде планируется: а) представить разные переводы текстов Тукая, написанных на старотатарском языке; b) расширить справочную зону статей, особенно её комментирующую и библиографическую части; c) отразить варианты прочтения и толкования тукаевских текстов разными исследователями.
В перспективе (после появления полного академического издания произведений Тукая) предполагается дополнить фонд и интернет-компонент: а) материалами текстов, не включённых в издания; b) единицами, встречающимися в вариантах произведений Тукая.
Интернет-компонент информационного комплекса «Словарь языка поэзии Габдуллы Тукая» значительно увеличивает количество входов в справочник, существенно расширяет возможности информационного поиска.
Авторы рассматривают интернет-версию информационного комплекса как основную и наиболее перспективную.