Надежда Соколова - Компьютерная лексикография

Компьютерная лексикография
Название: Компьютерная лексикография
Автор:
Жанры: Книги о компьютерах | Языкознание | Русский язык
Серии: Нет данных
ISBN: Нет данных
Год: 2019
О чем книга "Компьютерная лексикография"

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

Бесплатно читать онлайн Компьютерная лексикография


Введение

Современная языковая ситуация, и в частности потребности записи человеческого знания в память компьютера, в огромной степени изменили лексический мир языка. Можно считать, что здесь уже сложилась и развивается целая лингвистическая наука.

Компьютерная техника широко проникает в традиционную сферу лексикографии, то есть, в составление словарей, заменяя собой традиционную ручную картотеку и привнося новые методы и возможности в веками устанавливавшуюся технологию.

В области компьютерной лексикографии выделяют две основных проблемы, тесно связанных друг с другом: создание словарей, предназначенных для человека, и использование в интеллектуальных системах специальных машинных словарей естественных языков. Роль словаря в таких системах огромна – начиная с распознавания лексических единиц на уровне ввода и морфологического анализа и заканчивая моделированием элементов понимания и мышления.

Таким образом, в методологических целях следует разграничить вычислительную (компьютерную) лексикографию как часть обычной лексикографии, занимающуюся составлением обычных, бумажных словарей для использования их человеком и вычислительную лексикографию как науку о машинных словарях естественных языков, используемых в памяти компьютера для решения задач, требующих искусственного интеллекта.

Возможности компьютера в традиционной лексикографии чрезвычайно велики, поскольку они избавляют лексикографа от огромного многолетнего труда по сбору, расписыванию на карточки и анализу лексического материала. Например, можно создать справочник, в котором все словники наиболее значительных словарей были бы объединены. Таким справочником является Сводный словник словарей русского языка (Рогожникова 1986: 58-67). С помощью такого словника можно решать большое количество разного рода теоретических и практических задач. Так, можно выявить наиболее употребительную лексику современного русского языка и отобрать ее в словари различных объемов. Это важно при составлении толковых словарей, общего и учебного типа, для отбора лексики в русскоязычные словари других типов и т.д.

Применение интерактивных методов позволяет исследователю-лингвисту использовать компьютер даже в тех случаях, когда какие-то языковые факты трудно или невозможно формализовать: при помощи диалога с компьютером появляется возможность найти достаточно обоснованные и приемлемые приблизительные решения.

Ю.Н. Марчук в своей работе «Вычислительная лексикография» (Марчук 1976: 83) определил основные отличия машинных словарей от обычных. Кратко говоря, эти отличия заключаются в следующем: если обычный, традиционный, «бумажный» словарь комплементарен к знаниям, имеющимся у человека-пользователя, т.е. он дает некоторую дополнительную информацию к той, которая у человека уже есть, то машинный словарь в функции информирования автономен, т.е. он должен содержать всю необходимую для «искусственного интеллекта» машины информацию. Машинный словарь в применении в автоматизированных системах не может рассчитывать на то, что компьютер располагает «фоновым» знанием, необходимым для пользования словарем.

Машинный словарь должен содержать всю информацию, необходимую для работы с данным словом. Всякая неопределенность, неоднозначность, и т.п. сохранятся в выдаче, если в алгоритме работы с текстом не будут предусмотрены соответствующие процедуры.

1. История развития лексикографии

Лексикография (греч. lexikos – 'относящийся к слову' и grajw – 'пишу') – это научная дисциплина, занимающаяся теорией и практикой составления словарей. Еще в рукописях XI века (на полях или в самом тексте) можно встретить пояснения непонятных слов, чаще всего иноязычных или вышедших из употребления. Эти пояснения назывались глоссами, а собрания глосс, так называемые глоссарии, представляли собой первые небольшие словарики. В древнерусской лексикографии возникло несколько типов словарей: 1) словари собственных имен, содержащие в основном имена, упоминаемые в Библии (ономастиконы); 2) словари, охватывающие слова со сложным символическим смыслом (приточники); 3) словари, толкующие непонятные (церковно-славянские) слова книжной речи – "Толкование неудобь познаваемом речем"; 4) первые переводные словари, например, "Речь тонкословия греческого". Затем в XVI-XVII вв. появляются более полные собрания слов, расположенных в строгом алфавитном порядке, – азбуковники. Первый печатный словарь ("Лексис" Лаврентия Зизания) вышел в Вильно в 1596 году. Постепенно возникает интерес не только к старинным иностранным и старославянским словам, но и к словам современных иностранных языков, – начинают выходить многочисленные переводные словари: русско-иноязычные, иноязычно-русские. К 30-м годам XVIII века уже ощущалась потребность в толковом словаре русского языка, и с учреждением Российской Академии наук началось составление толкового "Словаря Академии Российской". В XIX веке было создано множество словарей самого различного характера, что обеспечило прекрасные предпосылки для развития лексикографии в XX веке – поистине, веке лексикографии, поскольку никогда еще эта дисциплина не развивалась столь успешно>1. Самая трудная часть работы историка-лексикографа – установление значения (семантики) слова. Для создания словаря необходимо провести отбор источников, анализ текстов, составление словников и словоуказателей, анализ словоупотреблений и т. д. Традиционно основой лексикографической технологии были рукописные картотеки (библиографические описания источников, цитат, словарных статей и т. п.). Благодаря чудовищной трудоемкости этой работы, помноженной на ответственность за ее результаты, словари часто называют по имени их создателя – Словарь Дашковой, Даля, Срезневского, Фасмера и т. д.>2

2. Истоки компьютерной лексикографии

Компьютерная лексикография возникла сравнительно недавно, и сейчас это быстро развивающаяся отрасль компьютерной индустрии – ведь "ословаривание" научного знания является одним из основных современных способов его проявления и распространения. Компьютерная лексикография – это также и становящаяся прикладная научная дисциплина в языкознании (лингвистике). Она изучает методы использования компьютерной техники для составления словарей. Это – временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям. Первые плоды развития этой дисциплины – встроенные в текстовые процессоры орфографические словари, а также многие другие информационно-программные продукты, активно использующиеся как в письменном, так и разговорном языковом творчестве.

Рассмотрим лишь один пример внедрения компьютерных технологий в современную лексикографию.


С этой книгой читают
Мне тридцать девять, и я поставила крест на своей личной жизни. Ни мужа, ни детей – не было, нет, и не будет. «Правда?» - усмехнулась судьба и закинула меня в тело принцессы – старой девы, сосланной отцом в дальнюю усадьбу. Теперь у меня есть и тишина, и покой, и деньги – все то, чего так не хватало на Земле. Что? Мужчина? Просит моей руки? А он-то мне зачем?
Из топ-менеджера в попаданки. Не о такой карьере я мечтала. Теперь мне предстоит думать, как возродить старинное поместье, где нанять людей для строительства в деревнях и как собрать богатый урожай. Меня мало интересует личная жизнь. Не сложилась она на Земле - не сложится и здесь. И не нужны мне никакие женихи. Сама со всем справлюсь. Сама, я сказала!
Многие незамужние женщины в тридцать семь считают себя старыми девами и ставят жирный крест на личной жизни. Я же попала в другой мир, обзавелась имуществом и получила доступ к магии. Правда, из имущества у меня всего лишь заброшенная усадьба в лесной глуши. А магия мне практически не подчиняется. Но я со всем разберусь, дайте только срок. Может, к тому времени и принц на белом коне появится.
Я жила спокойной размеренной жизнью, но внезапно оказалась в чужом мире, в чужом теле. Теперь я - черная вдова, та, на ком лежит проклятие. Моим именем пугают всех мужчин, от мала до велика. И я не против жить в одиночестве в шикарном замке, занимаясь делами поместья. Но как быть, если на пороге появляется очередной претендент на мою руку?
Словарь содержит более 42 000 аббревиатур и сокращений по информационным и компьютерным технологиям, а также по смежным областям знаний (электроника, радиотехника, связь и др.). Кроме того, в него включены наиболее распространённые общеупотребительные сокращения.Для широкого круга читателей, переводчиков, студентов, научных работников и технических специалистов.
Прогуливаясь по интернет-страницам, вам наверняка не раз приходилось сталкиваться с упоминаниями об iPad. Многих впечатляет, с каким нетерпением люди ждут выхода новых моделей этого легендарного планшета и наверняка возникает закономерный вопрос: «так для чего же нужен iPad и что он из себя представляет?» Сейчас, когда мы получили представление о том, что из себя представляет iPad, пора разобраться с тем, зачем нам вообще он так необходим и почем
В пособии излагаются основные тенденции развития организационного обеспечения безопасности информационных систем, а также подходы к анализу информационной инфраструктуры организационных систем и решению задач обеспечения безопасности компьютерных систем. Для студентов по направлению подготовки 230400 – Информационные системы и технологии (квалификация «бакалавр»).
Единой истины нет, все универсальные методики – ерунда. Как состояться в Интернете? Собственный взгляд. Метод включённого наблюдения, он же – Испытано на себе.
Каждый человек когда-либо видел сны, но чаще всего не помнит их в подробностях. Они могут быть цветными или черно-белыми, полнометражными или короткими. Кому-то снятся кошмары, а кто-то видит приключения, вещие сны. В этой книге сны воплощаются в рассказы. Автор видит сны как очередной рассказ или фильм. Запоминайте свои сны, пытайтесь разобраться в них. Где граница между сном и реальностью? Кто управляет сном?
Чем отличаются книги [Библиотеки Практичного Человека] серии «Это просто!»? Все темы можно вполне успешно изучить по статьям в интернете, где будут сотни и тысячи статей на интересующую вас тему. Будет много полезного, но и тонны мусора от дилетантов и теоретиков. Чем же отличаются книги автора? 1. Все рекомендации даются исходя из собственного многолетнего опыта проб и ошибок. 2. Это реальные алгоритмы, которые работают и которыми автор пользует
Что самое дорогое для человека в нашем суетном мире? Пожалуй, простое слово, идущее от сердца. Такова проза Людмилы Марковской, полная лиризма и проникновенности. Она, как бусины, выполненные в технике миллефиори, необычайно разнообразна и интересна. Книга написана лёгким, уверенным и полновесным слогом.В основе повествования – жизнь, полная очарований и разочарований, случайных встреч и странных совпадений.Сборник рассказов «Миллефиори» – это во
Истории которые я хочу поделиться с Вами, взяты из жизни. Они порой запутанные, болезненные, со следами разочарования, но всегда жизненные и правдивые.