Словарь
В.Н. Тришин. Большой словарь-справочник синонимов русского языка системы ASIS, версия 6.4, 24 апреля 2012 г. (свод общеупотребительной, специальной и заимствованной лексики с синонимическими рядами) размещен внизу данной страницы и его можно скачать бесплатно.
Словарь размещен в двух оболочках:
версии 6.* написаны на Visual FoxPro,
версии 7.* написаны на C# в среде разработки Microsoft Visual Studio 2008.
В новой версии синонимического словаря 6.4 добавлены новые слова и связи, изменена процедура установки словаря. Прошу пользователей словаря информировать обо всех найденных неточностях и ошибках.
Словарь синонимов защищен авторским правом. При размещении словаря на других сайтах ссылка на http://www.trishin.ru обязательна.
4 марта 2006 г. Ассоциация "Русские Рекорды" выдала Сертификат, удостоверяющий, что В.Н. Тришин является рекордсменом России.
Основанием для признания рекордного достижения является -
1.Самый большой электронный словарь-справочник русского языка.
2.Самое большое количество синонимов (толкований) в словаре-справочнике русского языка.
Публикации о словаре:
1. Л.Бачалаева "Словарь тянет на Гинесса", газета "Жизнь", №104, 13 мая 2004.
2. С.Голубицкий "Побочный продукт", компьютерный еженедельник "Компьютерра", №26-27, 2004.
3. С.Голубицкий "Морфинг", компьютерный еженедельник "Компьютерра", №29-30, 2004.
4. С.Костырко "WWW-обозрение", журнал "Новый мир", №9, 2005.
5. В.Н.Тришин "Электронный словарь-справочник синонимов русского языка системы ASIS" в книге "Владимир Даль в счастливом доме на Пресне", М.: изд-во "Academia", 2010, стр. 158-165.
1 . Назначение и особенности словаря.
Предлагаемый электронный синонимический словарь русского языка многофункционален.
Он может быть использован как орфографический словарь русского языка для проверки правильности написания слов, особенно при составлении документов с использованием сложных и редко встречающихся специальных терминов.
Как словарь синонимов и поясняющих слов он может использоваться при поиске близких по смыслу слов и выполнять функции толкового словаря при определении значений незнакомых слов.
Словарь может служить инструментом для филологических наблюдений и исследований языка благодаря развитой системе запросов по разным признакам слова (по значению, составу, синонимии и т.д.).
Сочинители стихов могут пользоваться словарём как машиной для подбора рифм. Кстати, поэт Е.А. Евтушенко, сравнивая русский и английский языки, высказал мнение, что "в английском нет столько рифм, сколько у нас и приходится рифмованный стих в связи с израсходованностью рифм на английский переводить без рифмы", см. http://www.echo.msk.ru/programs/beseda/43457/.
Могут им пользоваться как справочником и специалисты по всевозможным отраслям знаний для поиска нужной информации.
В словарях и справочниках книжного вида слова упорядочены по алфавиту, и если вы не помните точно, как оформлено нужное слово, то приходится просматривать сплошь весь словарь или справочник. В электронном же словаре можно искать искомое слово по обобщенному понятию; например, запрос (в версии 6.4) по слову "рыба" выдаст в алфавитном порядке список из 737 названий различных рыб, по слову "растение" - 4302, "гриб" – 366, "столица" - 274 названия существующих и бывших столиц, "минерал" - 5603, "взрывчатка" - 230, "богиня" - 346, милиционер - 62, "быстро" - 282, "умный" - 113, "глупый" - 215, "хороший" - 286, "плохой" - 302, "избивший" (избить) - 256, “трезвый” - 32, "выпивший" (выпить) - 350, "пьяный" - 323 (американский президент Бенджамин Франклин собрал около 200 синонимов слова "пьяный" (англ. Drunk)), и т.д.
В качестве примера "мощности", многозначности русского языка, даже по сравнению с английским, укажем на такие данные из этого словаря:
в русском языке, согласно словарю, имеют синонимы более 349878 слов и словосочетаний,
более 10 синонимов имеют 41196 слов и словосочетаний,
более 20 синонимов имеют 16573 слов и словосочетаний,
более 30 синонимов имеют 8145 слов и словосочетаний,
более 40 синонимов имеют 4451 слов и словосочетаний,
более 60 синонимов имеют 1602 слов и словосочетаний,
более 100 синонимов имеют 400 слов и словосочетаний,
более 200 синонимов имеют 81 слов и словосочетаний,
более 400 синонимов имеют 21 слов,
более 600 синонимов имеют 15 слов,
более 1000 синонимов имеют 7 слов.
Замечу, что полный словарь английского языка Уэбстера насчитывает около 425 000 слов и словосочетаний (данных об общем количестве синонимов в английском языке найти не удалось), в русском же языке, по моим оценкам, близкое к этому числу количество слов (порядка 440 тыс. слов и фразеологических оборотов и около 1830 тыс. синонимических связей), однако мне неизвестны работы по реальному сравнению "мощности" и "разветвлённости" различных языков.
Отмечу также, что сокращения (а их в русском языке более 130 тысяч, см. сайт http://www.sokr.ru/) в данный словарь не входят, кроме слоговых сокращений типа комсомол, минфин, спецназ и т.п.
Такое большое количество синонимов (связей) обусловлено двумя причинами:
1. В различных словарях синонимов словарные статьи к одному и тому же слову значительно отличаются, и, по сути, они дополняют друг друга. А поскольку в электронный словарь включены слова с синонимами практически из всех известных словарей, то в данном словаре пользователь получает их объединенный вариант.
2. Механизм перекрестных ссылок, реализованный в словаре, резко увеличивает число синонимов к словам. Поясним на примере. В словарях арго одним из синонимов к слову "оттянувшийся" обычно указывают слово "отдохнувший", но отдельной словарной статьи со словом "отдохнувший" в словарях арго нет. Более того, ни в одном синонимическом словаре среди синонимов к слову "отдохнувший" мы не нашли слова "оттянувшийся". Другие примеры: "схлестнувшийся" - повздоривший, "сдавший" - "выдавший", "сдвинутый" - "ненормальный", "содравший" - "укравший", "убойный" - "замечательный" и т.д. Электронный словарь устанавливает все возможные соответствия (это будет достигнуто, естественно, после завершения работы над словарём).
То есть синонимами в словаре могут быть не только слова и словосочетания современного общеупотребительного языка, но и устаревшие слова, просторечные, жаргонные, областные, слова профессиональной речи и т.п.
Данный синонимический словарь русского языка имеет несколько особенностей.
Отсутствие разделения омонимов, что приводит к тому, что в одной группе синонимов к слову, скажем, "стан" оказываются слова "лагерь", "блюминг" и "талия". Для развитого носителя языка это не представляет сложности, но для иностранца, желающего углубиться в недра русского языка, отсутствие разделения омонимов будет, конечно, представлять большие сложности. То есть для того же "стана" правильно было бы иметь несколько словарных статей, например:
Стан 1 => блюминг, трубопрокатник, листопрокатник, ...
Стан 2 => становище, стойбище, станица, бивуак, лагерь, ...
Стан 3 => торс, талия, поясница, ...
В будущих версиях словаря, возможно, такое разделение будет произведено.
Отсутствие разделения синонимических и родо-видовых связей. Родо-видовые отношения – это, вообще говоря, предмет тезаурусов. Синонимическое отношение - это отношение эквивалентности, которое разбивает все слова на классы эквивалентности. А родо-видовое отношение - отношение частичного порядка. Т.е. в идеале должна быть вкладка для синонимов, для родительских терминов и для дочерних. Такое разделение также планируется произвести в программе словаря после завершения работы над пополнением словаря.
Отнесение слова в словаре к какой-либо лексико-грамматической категории (части речи) чисто условно, что объясняется прикладным характером словаря. К примеру, причастия и прилагательные отнесены к одной и той же части речи "прилагательное", а наречия и деепричастия отнесены к части речи "наречие". Если слово может выступать в роли разных частей речи (омоформы), то оно отнесено к той, в форме которой наиболее часто встречается. Фразеологические и синтаксические синонимы, не определяемые вообще морфологически (как словосочетания), мы приписывали к части речи того слова, к которому эти фразеологические и синтаксические синонимы привязаны.
В словах специально-технического лексикона буква ё заменена на букву е, в обрабатываемых системой ASIS® материалах буква ё также заменена на букву е, поэтому в таких словах эта замена в словаре-справочнике также сделана. В последних версиях словаря-справочника слова с буквой ё имеются, а единственным синонимом к ним служат такие же слова с заменой соответствущих букв ё на букву е. Всего слов и выражений с буквой ё в словаре имеется 14597, в основном, из словарей Т.Ф. Ефремовой, В.В.Лопатина, академических словарей (последним отдавалось предпочтение в случае разночтений), других источников; в частности, использовались запросы из данной же словарной базы по фрагментам слов с имеющейся буквой ё с последующим анализом найденных слов. Это значительно прибавило число слов с буквой ё из специальных словарей, например, технических, где буква ё, к сожалению, обычно игнорируется. Если слово допускает двойное написание, то оно никак в словаре не выделяется. Я считаю, что применения буквы ё в современной русской письменности должно быть обязательным.
Во всех словах вместо прописных букв используются строчные буквы.
Нет знаков ударений в словах. Отсутствуют примечания типа: устарелое, просторечное, областное и т.п..
Частично уточнена орфография касательно приставки "бес", поврежденная в 1918 году: а именно, наряду со словами бесчестный, бестолковый, бессовестный и т.п. введены в словарь и слова безчестный, безтолковый, безсовестный и т.п.
Глаголы представлены в нескольких наиболее часто используемых формах. При этом редкие или устарелые глаголы представлены в одной форме.
Перечисленные особенности возникли из специфики и целевого назначение данного словаря, а именно - распознавание близких по смыслу именных словосочетаний в прикладной компьютерной системе ASIS®. На использование словаря в практической работе с текстами и документами отмеченные особенности не влияют.
- Понятие "синоним" мы используем в расширенном смысле. Нас интересует в первую очередь, являются ли взаимозаменяемыми конкретные слова в именных словосочетаниях (с сохранением хотя бы частично их смысла) или нет. Иначе говоря, улучшит ли установление синонимической связи между двумя конкретными словами качество распознавания смысла именных словосочетаний или нет при компьютерной обработке словосочетаний. А является ли данное слово точным синонимом другого слова или только квазисинонимом (близко по значению, но не взаимозаменяемым во всех контекстах) нас интересует во вторую очередь.
Данный словарь вместе с алгоритмом поиска может быть встроен нами и в другие компьютерные системы.
2. Поиск слов.
Простейший поиск слов выполняется по совпадению начального фрагмента слова с поисковым выражением. Переход к следующему слову производится повторным нажатием кнопки "Найти". Поиск слова выполняется циклически по всему словарю.
Для получения статистической информации и анализа структуры словарного фонда русского языка в систему добавлена возможность получения выборок по запросам. В качестве параметров запроса используются:
- начало слова,
- фрагмент слова,
- окончание слова,
- часть речи,
- количество синонимов (толкований) слова,
- количество букв в слове.
Можно осуществлять поиск и по комбинации параметров. Примеры. Запрос по фрагменту "вита" (слово "вита" в переводе с латинского означает "жизнь") в версии 6.4 даст 208 слова, а запрос по окончанию "метрия" (от греческого слова "метрео" – "измеряю") выдаст список из названий 357 дисциплин, в которых что-то меряют, а по окончанию "логия" (от греческого слова "логос" — слово, учение) выдаст список из названий 1124 научных и квазинаучных дисциплин. Замечу, что в "Советском энциклопедическом словаре" (4-е изд., 1990) содержится только около 200 статей о науках, направлениях и квазинауках, включающих в название элемент "-логия", которые перечислены и в Википедии, см. http://ru.wikipedia.org/wiki/-%EB%EE%E3%E8%FF.
3. Работа с синонимами (поясняющими словами) в версии 6.3.
Добавление синонима (толкования, поясняющего слова) к слову производится в режиме "Добавление синонимов (толкований)", переход в который выполняется нажатием соответствующей кнопки из меню. Добавление синонимов (толкований) к слову может быть произведено двойным щелчком левой клавиши мыши на выбранном слове в словаре или нажатием специальной кнопки, которая появляется только в этом режиме. Отмена режима добавления синонимов (толкований) выполняется щелчком левой клавиши мыши на флажке режима добавления синонимов (толкований).
Любой синоним (поясняющее слово) к конкретному слову имеет, в свою очередь, также синонимы (поясняющие слова). Для их просмотра достаточно в поле "наименование" правой панели сделать двойной клик левой клавишей мыши на выбранном синониме. При этом выбранное слово переходит из правой панели в левую.
Для удаления синонимов (толкований) нужно выделить слово в списке синонимов (толкований), а затем нажать кнопку со знаком минус из меню.
4. Дополнительные возможности.
При нажатии кнопки "Справка" формируются дополнительные данные по всему словарю либо выборке, эта операция занимает значительное время (несколько секунд).
Вы можете расширить словарь, добавив новые слова. После нажатия кнопки "Новое слово" нужно написать вводимое слово и затем выбрать его часть речи. При выборе существительного или прилагательного вы попадете в таблицу выбора образца склонения. Выбрав подходящий тип склонения, новое слово можно записать в словарь.
5. Совместная работа словаря и Word.
Словарь является динамическим, и его размеры можно менять с помощью мыши. Сделав словарь небольшим по размеру и параллельно вызвав текстовый файл в Word можно редактировать этот файл с помощью словаря. А именно, можно выделенное слово из текстового файла с помощью клавиш Ctrl-C, Ctrl-V занести в поисковое окно словаря, а найденный синоним затем с помощью клавиш Ctrl-C, Ctrl-V поместить в текстовый файл.
6. Алгоритм поиска близких по смыслу наименований объектов.
Наименования объектов представляют собой именные словосочетания, содержащие главное слово и несколько уточняющих слов. Например, "станок настольно-сверлильный 2М-112", "вертикально-фрезерный станок", "холодильная установка 24 МКТ 280". Предполагается, что в наименовании всегда есть одно главное слово, которое находится в именительном падеже в единственном или множественном числе. Алгоритм поиска близких по смыслу наименований начинается с выделения главного слова и всех его синонимов. Затем выделяются уточняющие слова и составляются списки их синонимов. Поиск близких по смыслу наименований производится в базе наименований и начинается с выделения всех наименований, имеющих главное слово, совпадающее с главным словом входного наименования или его синонимом. Для каждого из отобранных наименований рассчитывается значение критерия близости. Критерий является суммой экспериментально подобранных весовых коэффициентов для главного и уточняющих слов. Например, главное слово имеет вес 1, синоним главного слова 0.9, уточняющее слово 0.8, синоним уточняющего слова 0.7, а, допустим, наименование марки изделия - 2.5. Все наименования-кандидаты упорядочиваются в порядке убывания значения критерия и в таком виде предлагаются пользователю для окончательного выбора.
В системе ASIS® поиск близких по смыслу наименований производится в базах аналогов машин и оборудования, а также классификатора ОКОФ.
Для ускорения поиска предварительно выполняется разбор всех наименований в каждой базе аналогов. Результаты этого разбора хранятся в специальных файлах и содержат не сами слова, а их коды в виде ссылок на записи словаря слов системы ASIS®. Аналогичный файл результатов разбора составляется и для наименований классов классификатора ОКОФ.
7. Использованная для создания словаря литература и получение словаря.
Словарная база включает слова не только технического содержания. Более пятнадцати лет она пополнялась словами из словарей и справочников по всем отраслям знаний: от астрономии до японской живописи. При составлении словаря были использованы изданные словари: орфографические, синонимические, фразеологических синонимов, толковые, церковно-славянских слов, иностранных слов, арго (кроме заведомо ненормативной лексики) и т.п. Кроме того, для пополнения словаря активно использовались газеты, журналы, Интернет (в том числе и словари-подсказчики слов по их началу Yandex и Google), так как даже в самых крупных печатных словарях отсутствуют тысячи широко распространенных в быту и прессе современных слов, например, госучастие, эсэмэска, моногород, спецлаборатория, промпроизводство, медсправка, педколледж, зоопарикмахер, внеоборотный, внеофисный, предшкольный, межкорпоративный, самораспаковывающийся, кибертерроризм, погранслужба, госсимволика, штрафстоянка (1 млн. ссылок в Яндексе), автоэксперт (27 млн. ссылок в Яндексе) и т.д. В данном словаре имеется 238 слов, начинающихся с «нано», а в новом Большом академическом словаре таких слов имеется всего 13. Основной пласт слов академических словарей занимают, как правило, слова и отрывки с соответствующими словами из произведений русских писателей 19-20 веков А.И. Герцена, Н.П. Огарева, А.Ф. Писемского, В.Г. Белинского, Н.Г. Чернышевского, Ф.М. Достоевского, М.Е. Салтыкова-Щедрина, Н.В. Гоголя, А.М. Горького и многих других, которые считались классиками в работах советских литературоведов. Устаревшие и редкие слова из академических словарей в словаре-справочнике также имеются. Критерием отбора терминов в словарь является и их широкое употребление хотя бы в определенных социальных или профессиональных группах людей.
Две версии словаря:
1) Начиная с 16 февраля 2012 года, словарь выпускается в версии 7.3 на 416 тыс. слов и словосочетаний, из которых 342 тыс. снабжены синонимами, квазисинонимами (сходными по смыслу выражениями), 1757 тыс. синонимических связей, написанной на C# в среде разработки Microsoft Visual Studio 2008. Версия 7.3 легка в установке (при установке должен быть подключён интернет), в ней более мощная (но и более сложная в использовании) поисковая система, чем в версии 6.*, но в ней нельзя добавлять слова.
Как установить словарь на 32-битную ОС Windows
1. Скачиваем архив slovar7_3.rar здесь и разархивируем его в отдельной директории.
2. Стартуем DictionarySetup.exe и следуем указаниям мастера установки.
Мастер установки проверяет состояние вашей операционной системы и при необходимости загружает с сайта Майкрософт недостающие компоненты, поэтому должен быть подключен Интернет.
3. Если при запуске словаря вы получаете сообщение "Не удалось подключиться к базе данных…”, это значит, что в вашей операционной системе не установлена соответствующая компонента доступа к данным. Пройдите по ссылке http://www.microsoft.com/download/en/details.aspx?id=13255 и установите 32-битную версию пакета.
Как установить словарь на 64-битную ОС Windows
1. Скачиваем архив slovar7_3.rar здесь и разархивируем его в отдельной директории.
2. Стартуем DictionarySetup.exe и следуем указаниям мастера установки.
Мастер установки проверяет состояние вашей операционной системы и при необходимости загружает с сайта Майкрософт недостающие компоненты, поэтому должен быть подключен Интернет.
3. Если при запуске словаря вы получаете сообщение "Не удалось подключиться к базе данных…”, это значит, что в вашей операционной системе не установлена соответствующая компонента доступа к данным. Пройдите по ссылке http://www.microsoft.com/download/en/details.aspx?id=13255 и установите 64-битную версию пакета.
4. Отмечены случаи, когда установщик этого пакета отказывается устанавливать его. Например, когда на вашей 64-битной операционной системе уже стоит 32-битный MS Office. В этом случае нужно удалить установленный словарь через панель управления Windows, затем скачать архив slovar7_3_32for_64.rar (скачиваем здесь) и последовать указаниям по установке для 32-битной операционной системы, начиная с пункта 3.
Замечание. В данном словаре ссылки на синонимы стали шифроваться начиная с 2010 года с версии 6.0 в качестве защиты от недобросовестных пользователей. Это связано с тем, что практически все безымянные «всеобъемлющие» синонимические словари русского языка в интернете (их более 10 штук) имеют в основе своей словарь ASIS 2010 года без указания первоосновы и её автора, что легко проверяется, так как в них имеются те же ошибки, а синонимы в них находятся в том же порядке, что и в словаре 2010 года. Не случайно ни количество слов, ни количество синонимов в этих словарях не указано.
2) Версия словаря на Visual FoxPro.
24 апреля 2012 года размещена версия словаря 6.4 на 425 тыс. слов и выражений, из которых 350 тыс. снабжены синонимами, квазисинонимами, поясняющими словами (сходными по смыслу выражениями). Всего синонимов (поясняющих слов) около 1787 тыс. В этой версии исправлены многие ошибки в словарной базе версии 7.3. Программа установки словаря Setup перестала справляться с большими объемами словаря. Поэтому установку словаря 6.4 разбита на два этапа:
-
Установка словаря на две записи (при этом прописываются в Windows библиотека Fox Pro) – скачать ustan_bibl.rar . Перед установкой прочитайте readme1.
-
Удаление словаря на две записи и установка на его место словаря на 425 тыс. записей – скачать DICASIS6-4.RAR . Перед установкой прочитайте readme2.





