В субботу у нас с Костей будет доклад на семинаре в МГУ. Приходите!
Если у вас нет пропуска, то нужно зарегистрироваться до 15:00 среды (23 ноября) на странице http://goo.gl/xWBUqd
На 224-м занятии семинара "Некоторые применения математических методов в языкознании", 26 ноября 2016 г., в 13:00 в ауд. 951
выступят Константин Александрович Лопухин и Анастасия Александровна Лопухина
с докладом "Автоматическое выделение значений слов: семантические векторы вместо лексикографов?".
Вопрос о том, как определить значение слова, был и остается одним из самых сложных и спорных в лингвистике. Одно из возможных его решений основывается на принципах дистрибутивной семантики — “you shall know a word by the company it keeps” (Firth 1957). Эти принципы легли в основу методов автоматического извлечения значений слов из корпусов текстов при помощи семантических векторов (word sense induction).
В докладе речь пойдет об автоматическом выделении значений слов для русского языка. В первой части мы сравним четыре метода: word2vec neighbours и context clustering, основанные на векторном представлении слов и контекстов, метод AdaGram, использующий векторное представление значений слов, и latent Dirichlet allocation. Кроме того, мы сопоставим результаты автоматического извлечения значений с данными словаря и результатами психолингвистических экспериментов. Во второй части мы расскажем об исследованиях автоматического извлечения слов с регулярной полисемией и покажем, как векторы значений позволяют решить эту задачу более простым и естественным способом.
Если у вас нет пропуска, то нужно зарегистрироваться до 15:00 среды (23 ноября) на странице http://goo.gl/xWBUqd
На 224-м занятии семинара "Некоторые применения математических методов в языкознании", 26 ноября 2016 г., в 13:00 в ауд. 951
выступят Константин Александрович Лопухин и Анастасия Александровна Лопухина
с докладом "Автоматическое выделение значений слов: семантические векторы вместо лексикографов?".
Вопрос о том, как определить значение слова, был и остается одним из самых сложных и спорных в лингвистике. Одно из возможных его решений основывается на принципах дистрибутивной семантики — “you shall know a word by the company it keeps” (Firth 1957). Эти принципы легли в основу методов автоматического извлечения значений слов из корпусов текстов при помощи семантических векторов (word sense induction).
В докладе речь пойдет об автоматическом выделении значений слов для русского языка. В первой части мы сравним четыре метода: word2vec neighbours и context clustering, основанные на векторном представлении слов и контекстов, метод AdaGram, использующий векторное представление значений слов, и latent Dirichlet allocation. Кроме того, мы сопоставим результаты автоматического извлечения значений с данными словаря и результатами психолингвистических экспериментов. Во второй части мы расскажем об исследованиях автоматического извлечения слов с регулярной полисемией и покажем, как векторы значений позволяют решить эту задачу более простым и естественным способом.
On Saturday, Kostya and I will have a report at a seminar at Moscow State University. Come!
If you do not have a pass, you need to register before 15:00 on Wednesday (November 23) at http://goo.gl/xWBUqd
At the 224th session of the seminar "Some applications of mathematical methods in linguistics", November 26, 2016, at 13:00 in the auditorium. 951
Konstantin Alexandrovich Lopukhin and Anastasia Alexandrovna Lopukhina will perform
with the report "Automatic selection of word meanings: semantic vectors instead of lexicographers?".
The question of how to determine the meaning of a word has been and remains one of the most complex and controversial in linguistics. One of its possible solutions is based on the principles of distributive semantics - “you shall know a word by the company it keeps” (Firth 1957). These principles formed the basis of methods for automatically extracting the meaning of words from the corpus of texts using semantic vectors (word sense induction).
The report will focus on the automatic allocation of word meanings for the Russian language. In the first part, we compare four methods: word2vec neighbors and context clustering, based on the vector representation of words and contexts, the AdaGram method, which uses the vector representation of word meanings, and latent Dirichlet allocation. In addition, we compare the results of automatic extraction of values with dictionary data and the results of psycholinguistic experiments. In the second part, we will talk about research on automatic word extraction with regular polysemy and show how value vectors can solve this problem in a simpler and more natural way.
If you do not have a pass, you need to register before 15:00 on Wednesday (November 23) at http://goo.gl/xWBUqd
At the 224th session of the seminar "Some applications of mathematical methods in linguistics", November 26, 2016, at 13:00 in the auditorium. 951
Konstantin Alexandrovich Lopukhin and Anastasia Alexandrovna Lopukhina will perform
with the report "Automatic selection of word meanings: semantic vectors instead of lexicographers?".
The question of how to determine the meaning of a word has been and remains one of the most complex and controversial in linguistics. One of its possible solutions is based on the principles of distributive semantics - “you shall know a word by the company it keeps” (Firth 1957). These principles formed the basis of methods for automatically extracting the meaning of words from the corpus of texts using semantic vectors (word sense induction).
The report will focus on the automatic allocation of word meanings for the Russian language. In the first part, we compare four methods: word2vec neighbors and context clustering, based on the vector representation of words and contexts, the AdaGram method, which uses the vector representation of word meanings, and latent Dirichlet allocation. In addition, we compare the results of automatic extraction of values with dictionary data and the results of psycholinguistic experiments. In the second part, we will talk about research on automatic word extraction with regular polysemy and show how value vectors can solve this problem in a simpler and more natural way.
У записи 19 лайков,
1 репостов.
1 репостов.
Эту запись оставил(а) на своей стене Анастасия Лопухина