Надежда Соколова - Компьютерная лексикография

Компьютерная лексикография
Название: Компьютерная лексикография
Автор:
Жанры: Книги о компьютерах | Языкознание | Русский язык
Серии: Нет данных
ISBN: Нет данных
Год: 2019
О чем книга "Компьютерная лексикография"

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

Бесплатно читать онлайн Компьютерная лексикография


Введение

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.

Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

В области компьютерной лексикографии выделяют две основных проблемы, тесно связанных друг с другом: создание словарей, предназначенных для человека, и использование в интеллектуальных системах специальных машинных словарей естественных языков. Роль словаря в таких системах огромна – начиная с распознавания лексических единиц на уровне ввода и морфологического анализа и заканчивая моделированием элементов понимания и мышления.

Таким образом, в методологических целях следует разграничить вычислительную (компьютерную) лексикографию как часть обычной лексикографии, занимающуюся составлением обычных, бумажных словарей для использования их человеком и вычислительную лексикографию как науку о машинных словарях естественных языков, используемых в памяти компьютера для решения задач, требующих искусственного интеллекта.

Возможности компьютера в традиционной лексикографии чрезвычайно велики, поскольку они избавляют лексикографа от огромного многолетнего труда по сбору, расписыванию на карточки и анализу лексического материала. Например, можно создать справочник, в котором все словники наиболее значительных словарей были бы объединены. Таким справочником является Сводный словник словарей русского языка (Рогожникова 1986: 58-67). С помощью такого словника можно решать большое количество разного рода теоретических и практических задач. Так, можно выявить наиболее употребительную лексику современного русского языка и отобрать ее в словари различных объемов. Это важно при составлении толковых словарей, общего и учебного типа, для отбора лексики в русскоязычные словари других типов и т.д.

Применение интерактивных методов позволяет исследователю-лингвисту использовать компьютер даже в тех случаях, когда какие-то языковые факты трудно или невозможно формализовать: при помощи диалога с компьютером появляется возможность найти достаточно обоснованные и приемлемые приблизительные решения.

Ю.Н. Марчук в своей работе «Вычислительная лексикография» (Марчук 1976: 83) определил основные отличия машинных словарей от обычных. Кратко говоря, эти отличия заключаются в следующем: если обычный, традиционный, «бумажный» словарь комплементарен к знаниям, имеющимся у человека-пользователя, т.е. он дает некоторую дополнительную информацию к той, которая у человека уже есть, то машинный словарь в функции информирования автономен, т.е. он должен содержать всю необходимую для «искусственного интеллекта» машины информацию. Машинный словарь в применении в автоматизированных системах не может рассчитывать на то, что компьютер располагает «фоновым» знанием, необходимым для пользования словарем.

Машинный словарь должен содержать всю информацию, необходимую для работы с данным словом. Всякая неопределенность, неоднозначность, и т.п. сохранятся в выдаче, если в алгоритме работы с текстом не будут предусмотрены соответствующие процедуры.

1. История развития лексикографии

Лексикография (греч. lexikos – 'относящийся к слову' и grajw – 'пишу') – это научная дисциплина, занимающаяся теорией и практикой составления словарей. Еще в рукописях XI века (на полях или в самом тексте) можно встретить пояснения непонятных слов, чаще всего иноязычных или вышедших из употребления. Эти пояснения назывались глоссами, а собрания глосс, так называемые глоссарии, представляли собой первые небольшие словарики. В древнерусской лексикографии возникло несколько типов словарей: 1) словари собственных имен, содержащие в основном имена, упоминаемые в Библии (ономастиконы); 2) словари, охватывающие слова со сложным символическим смыслом (приточники); 3) словари, толкующие непонятные (церковно-славянские) слова книжной речи – "Толкование неудобь познаваемом речем"; 4) первые переводные словари, например, "Речь тонкословия греческого". Затем в XVI-XVII вв. появляются более полные собрания слов, расположенных в строгом алфавитном порядке, – азбуковники. Первый печатный словарь ("Лексис" Лаврентия Зизания) вышел в Вильно в 1596 году. Постепенно возникает интерес не только к старинным иностранным и старославянским словам, но и к словам современных иностранных языков, – начинают выходить многочисленные переводные словари: русско-иноязычные, иноязычно-русские. К 30-м годам XVIII века уже ощущалась потребность в толковом словаре русского языка, и с учреждением Российской Академии наук началось составление толкового "Словаря Академии Российской". В XIX веке было создано множество словарей самого различного характера, что обеспечило прекрасные предпосылки для развития лексикографии в XX веке – поистине, веке лексикографии, поскольку никогда еще эта дисциплина не развивалась столь успешно>1. Самая трудная часть работы историка-лексикографа – установление значения (семантики) слова. Для создания словаря необходимо провести отбор источников, анализ текстов, составление словников и словоуказателей, анализ словоупотреблений и т. д. Традиционно основой лексикографической технологии были рукописные картотеки (библиографические описания источников, цитат, словарных статей и т. п.). Благодаря чудовищной трудоемкости этой работы, помноженной на ответственность за ее результаты, словари часто называют по имени их создателя – Словарь Дашковой, Даля, Срезневского, Фасмера и т. д.>2

2. Истоки компьютерной лексикографии

Компьютерная лексикография возникла сравнительно недавно, и сейчас это быстро развивающаяся отрасль компьютерной индустрии – ведь "ословаривание" научного знания является одним из основных современных способов его проявления и распространения. Компьютерная лексикография – это также и становящаяся прикладная научная дисциплина в языкознании (лингвистике). Она изучает методы использования компьютерной техники для составления словарей. Это – временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям. Первые плоды развития этой дисциплины – встроенные в текстовые процессоры орфографические словари, а также многие другие информационно-программные продукты, активно использующиеся как в письменном, так и разговорном языковом творчестве.

Рассмотрим лишь один пример внедрения компьютерных технологий в современную лексикографию.


С этой книгой читают
Мне тридцать девять, и я поставила крест на своей личной жизни. Ни мужа, ни детей – не было, нет, и не будет. «Правда?» - усмехнулась судьба и закинула меня в тело принцессы – старой девы, сосланной отцом в дальнюю усадьбу. Теперь у меня есть и тишина, и покой, и деньги – все то, чего так не хватало на Земле. Что? Мужчина? Просит моей руки? А он-то мне зачем?
Из топ-менеджера в попаданки. Не о такой карьере я мечтала. Теперь мне предстоит думать, как возродить старинное поместье, где нанять людей для строительства в деревнях и как собрать богатый урожай. Меня мало интересует личная жизнь. Не сложилась она на Земле - не сложится и здесь. И не нужны мне никакие женихи. Сама со всем справлюсь. Сама, я сказала!
Многие незамужние женщины в тридцать семь считают себя старыми девами и ставят жирный крест на личной жизни. Я же попала в другой мир, обзавелась имуществом и получила доступ к магии. Правда, из имущества у меня всего лишь заброшенная усадьба в лесной глуши. А магия мне практически не подчиняется. Но я со всем разберусь, дайте только срок. Может, к тому времени и принц на белом коне появится.
Я жила спокойной размеренной жизнью, но внезапно оказалась в чужом мире, в чужом теле. Теперь я - черная вдова, та, на ком лежит проклятие. Моим именем пугают всех мужчин, от мала до велика. И я не против жить в одиночестве в шикарном замке, занимаясь делами поместья. Но как быть, если на пороге появляется очередной претендент на мою руку?
В пособии излагаются основные тенденции развития организационного обеспечения безопасности информационных систем, а также подходы к анализу информационной инфраструктуры организационных систем и решению задач обеспечения безопасности компьютерных систем. Для студентов по направлению подготовки 230400 – Информационные системы и технологии (квалификация «бакалавр»).
Татьяна Поварова – успешный предприниматель, организатор мероприятий, преподаватель, живущий в Канаде и в России, впервые делится с читателями секретами самых экстравагантных её начинаний.Ещё до окончания написания «Инкубатора для Журавлей» Татьяна получила приглашения с презентацией книги из различных городов России.Главным вдохновением книги стали подписчики одного из Youtube каналов автора – AtomyXXII.Вот так виртуальное знакомство привело к р
В монографии дается краткое и развернутое определение, описываются существенные характеристики ассоциированного сверх-адаптивного интеллекта (АСИ). Приводится теоретическое обоснование АСИ. Рассматриваются эвристические перспективы использования идеи и методологии АСИ в сфере преодоления системного научного и цивилизационного кризиса. Оцениваются конкретные шаги по разработке теории и технологической практики АСИ. Книга полезна для исследователей
Международный научный журнал «Все науки», созданный при OOO «Electron Laboratory» и Научной школе «Электрон», является научным изданием, публикующим последние научные результаты в самых различных областях науки и техники. В настоящем выпуске представлены статьи, признанные достойными для публикации из числа направленных, в ходе I Международной научной конференции «Современные проблемы науки, техники и производства», приуроченная к II-годовщине El
Каждый человек когда-либо видел сны, но чаще всего не помнит их в подробностях. Они могут быть цветными или черно-белыми, полнометражными или короткими. Кому-то снятся кошмары, а кто-то видит приключения, вещие сны. В этой книге сны воплощаются в рассказы. Автор видит сны как очередной рассказ или фильм. Запоминайте свои сны, пытайтесь разобраться в них. Где граница между сном и реальностью? Кто управляет сном?
Чем отличаются книги [Библиотеки Практичного Человека] серии «Это просто!»? Все темы можно вполне успешно изучить по статьям в интернете, где будут сотни и тысячи статей на интересующую вас тему. Будет много полезного, но и тонны мусора от дилетантов и теоретиков. Чем же отличаются книги автора? 1. Все рекомендации даются исходя из собственного многолетнего опыта проб и ошибок. 2. Это реальные алгоритмы, которые работают и которыми автор пользует
Какой была ваша юность? Опишите запах, цвет, эмоцию. Я в цветущие 20 лет радуюсь тому, что могу познать нечто новое. Это не грустная юность, но и не та, какую вы себе представили.
Будущее изменчиво. Разведчик Коликов, как никто другой знает это, ведь его работа – проникать в сознание людей прошлого, играть с чужим разумом, перекраивать под себя реальность и влиять на судьбы миллиардов людей на планете. В своём деле Коликов хорош, но очередное задание всё изменило. Коликову предстоит внедрение в разум прекрасной незнакомки из прошлого. Как в одной голове уживутся два сознания? Как молодому мужчине вести себя в теле соблазни