Надежда Соколова - Компьютерная лексикография

Компьютерная лексикография
Название: Компьютерная лексикография
Автор:
Жанры: Книги о компьютерах | Языкознание | Русский язык
Серии: Нет данных
ISBN: Нет данных
Год: 2019
О чем книга "Компьютерная лексикография"

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

Бесплатно читать онлайн Компьютерная лексикография


Введение

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.

Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

В области компьютерной лексикографии выделяют две основных проблемы, тесно связанных друг с другом: создание словарей, предназначенных для человека, и использование в интеллектуальных системах специальных машинных словарей естественных языков. Роль словаря в таких системах огромна – начиная с распознавания лексических единиц на уровне ввода и морфологического анализа и заканчивая моделированием элементов понимания и мышления.

Таким образом, в методологических целях следует разграничить вычислительную (компьютерную) лексикографию как часть обычной лексикографии, занимающуюся составлением обычных, бумажных словарей для использования их человеком и вычислительную лексикографию как науку о машинных словарях естественных языков, используемых в памяти компьютера для решения задач, требующих искусственного интеллекта.

Возможности компьютера в традиционной лексикографии чрезвычайно велики, поскольку они избавляют лексикографа от огромного многолетнего труда по сбору, расписыванию на карточки и анализу лексического материала. Например, можно создать справочник, в котором все словники наиболее значительных словарей были бы объединены. Таким справочником является Сводный словник словарей русского языка (Рогожникова 1986: 58-67). С помощью такого словника можно решать большое количество разного рода теоретических и практических задач. Так, можно выявить наиболее употребительную лексику современного русского языка и отобрать ее в словари различных объемов. Это важно при составлении толковых словарей, общего и учебного типа, для отбора лексики в русскоязычные словари других типов и т.д.

Применение интерактивных методов позволяет исследователю-лингвисту использовать компьютер даже в тех случаях, когда какие-то языковые факты трудно или невозможно формализовать: при помощи диалога с компьютером появляется возможность найти достаточно обоснованные и приемлемые приблизительные решения.

Ю.Н. Марчук в своей работе «Вычислительная лексикография» (Марчук 1976: 83) определил основные отличия машинных словарей от обычных. Кратко говоря, эти отличия заключаются в следующем: если обычный, традиционный, «бумажный» словарь комплементарен к знаниям, имеющимся у человека-пользователя, т.е. он дает некоторую дополнительную информацию к той, которая у человека уже есть, то машинный словарь в функции информирования автономен, т.е. он должен содержать всю необходимую для «искусственного интеллекта» машины информацию. Машинный словарь в применении в автоматизированных системах не может рассчитывать на то, что компьютер располагает «фоновым» знанием, необходимым для пользования словарем.

Машинный словарь должен содержать всю информацию, необходимую для работы с данным словом. Всякая неопределенность, неоднозначность, и т.п. сохранятся в выдаче, если в алгоритме работы с текстом не будут предусмотрены соответствующие процедуры.

1. История развития лексикографии

Лексикография (греч. lexikos – 'относящийся к слову' и grajw – 'пишу') – это научная дисциплина, занимающаяся теорией и практикой составления словарей. Еще в рукописях XI века (на полях или в самом тексте) можно встретить пояснения непонятных слов, чаще всего иноязычных или вышедших из употребления. Эти пояснения назывались глоссами, а собрания глосс, так называемые глоссарии, представляли собой первые небольшие словарики. В древнерусской лексикографии возникло несколько типов словарей: 1) словари собственных имен, содержащие в основном имена, упоминаемые в Библии (ономастиконы); 2) словари, охватывающие слова со сложным символическим смыслом (приточники); 3) словари, толкующие непонятные (церковно-славянские) слова книжной речи – "Толкование неудобь познаваемом речем"; 4) первые переводные словари, например, "Речь тонкословия греческого". Затем в XVI-XVII вв. появляются более полные собрания слов, расположенных в строгом алфавитном порядке, – азбуковники. Первый печатный словарь ("Лексис" Лаврентия Зизания) вышел в Вильно в 1596 году. Постепенно возникает интерес не только к старинным иностранным и старославянским словам, но и к словам современных иностранных языков, – начинают выходить многочисленные переводные словари: русско-иноязычные, иноязычно-русские. К 30-м годам XVIII века уже ощущалась потребность в толковом словаре русского языка, и с учреждением Российской Академии наук началось составление толкового "Словаря Академии Российской". В XIX веке было создано множество словарей самого различного характера, что обеспечило прекрасные предпосылки для развития лексикографии в XX веке – поистине, веке лексикографии, поскольку никогда еще эта дисциплина не развивалась столь успешно>1. Самая трудная часть работы историка-лексикографа – установление значения (семантики) слова. Для создания словаря необходимо провести отбор источников, анализ текстов, составление словников и словоуказателей, анализ словоупотреблений и т. д. Традиционно основой лексикографической технологии были рукописные картотеки (библиографические описания источников, цитат, словарных статей и т. п.). Благодаря чудовищной трудоемкости этой работы, помноженной на ответственность за ее результаты, словари часто называют по имени их создателя – Словарь Дашковой, Даля, Срезневского, Фасмера и т. д.>2

2. Истоки компьютерной лексикографии

Компьютерная лексикография возникла сравнительно недавно, и сейчас это быстро развивающаяся отрасль компьютерной индустрии – ведь "ословаривание" научного знания является одним из основных современных способов его проявления и распространения. Компьютерная лексикография – это также и становящаяся прикладная научная дисциплина в языкознании (лингвистике). Она изучает методы использования компьютерной техники для составления словарей. Это – временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям. Первые плоды развития этой дисциплины – встроенные в текстовые процессоры орфографические словари, а также многие другие информационно-программные продукты, активно использующиеся как в письменном, так и разговорном языковом творчестве.

Рассмотрим лишь один пример внедрения компьютерных технологий в современную лексикографию.


С этой книгой читают
Мне тридцать девять, и я поставила крест на своей личной жизни. Ни мужа, ни детей – не было, нет, и не будет. «Правда?» - усмехнулась судьба и закинула меня в тело принцессы – старой девы, сосланной отцом в дальнюю усадьбу. Теперь у меня есть и тишина, и покой, и деньги – все то, чего так не хватало на Земле. Что? Мужчина? Просит моей руки? А он-то мне зачем?
Из топ-менеджера в попаданки. Не о такой карьере я мечтала. Теперь мне предстоит думать, как возродить старинное поместье, где нанять людей для строительства в деревнях и как собрать богатый урожай. Меня мало интересует личная жизнь. Не сложилась она на Земле - не сложится и здесь. И не нужны мне никакие женихи. Сама со всем справлюсь. Сама, я сказала!
Многие незамужние женщины в тридцать семь считают себя старыми девами и ставят жирный крест на личной жизни. Я же попала в другой мир, обзавелась имуществом и получила доступ к магии. Правда, из имущества у меня всего лишь заброшенная усадьба в лесной глуши. А магия мне практически не подчиняется. Но я со всем разберусь, дайте только срок. Может, к тому времени и принц на белом коне появится.
Я жила спокойной размеренной жизнью, но внезапно оказалась в чужом мире, в чужом теле. Теперь я - черная вдова, та, на ком лежит проклятие. Моим именем пугают всех мужчин, от мала до велика. И я не против жить в одиночестве в шикарном замке, занимаясь делами поместья. Но как быть, если на пороге появляется очередной претендент на мою руку?
С точки зрения инженера.Любое договорное знание.В Небытии.Настоящего.Является Софизмом.Истина, Творение, Сущее и Бытие.Непознаваемы.В данной книге излагаются.Творение Дуализма Небытия и Бытия.Трактат о Творении Дуализма.
…Поистине неисповедимы пути Господни. Мы не можем знать, куда он направит нас завтра, через месяц, через год. Как отзовется наше слово, наше действие – все это в руках и помыслах Всевышнего.Но мы точно знаем, что он нас бережет, он не дает нам испытаний, которых мы не могли бы вынести. Он ведет нас так, как надо.
Добро пожаловать в удивительную вселенную кибербезопасности, где вас ждут ответы на самые актуальные на сегодняшний день вопросы: Что конкретно мне необходимо сделать, чтобы защитить свои данные? Почему только одного антивируса недостаточно? Чем я рискую, подключаясь к бесплатному Wi-Fi? Насколько защищены мои данные в облачных хранилищах? И многое другое. Книга написана в виде небольших уроков с конкретными действиями, которые описаны простым, н
При генерации новых изображений с помощью искусственного интеллекта, очень часто спонтанно возникают фантастические образы различных химер. Эти необычные сказочные образы очаровывают вас своей красотой и вы уже не можете с ними расстаться. В результате я получил целую коллекцию необычных красочных изображений котопетушков, пленяющих человеческое воображение, часть из которых были использованы мною для подготовки к изданию данного календаря.
Каждый человек когда-либо видел сны, но чаще всего не помнит их в подробностях. Они могут быть цветными или черно-белыми, полнометражными или короткими. Кому-то снятся кошмары, а кто-то видит приключения, вещие сны. В этой книге сны воплощаются в рассказы. Автор видит сны как очередной рассказ или фильм. Запоминайте свои сны, пытайтесь разобраться в них. Где граница между сном и реальностью? Кто управляет сном?
Чем отличаются книги [Библиотеки Практичного Человека] серии «Это просто!»? Все темы можно вполне успешно изучить по статьям в интернете, где будут сотни и тысячи статей на интересующую вас тему. Будет много полезного, но и тонны мусора от дилетантов и теоретиков. Чем же отличаются книги автора? 1. Все рекомендации даются исходя из собственного многолетнего опыта проб и ошибок. 2. Это реальные алгоритмы, которые работают и которыми автор пользует
Библиотека проекта «История Российского государства» – это рекомендованные Борисом Акуниным лучшие памятники мировой литературы, в которых отражена биография нашей страны от самых ее истоков.Александр Васильевич Герасимов (1861–1944) возглавлял Петербургское охранное отделение в 1905–1914 годах. В своих воспоминаниях, освещающих историю революционного террора в России, он рассказал о своей борьбе с террористами разных мастей и направлений, работе
Восточная легенда о том, как по воле эмира мудрец Карим отправился на поиски сути земного бытия, а также о том, с кем ему приходилось встречаться во время своего нелегкого путешествия.