AAA
Обычный Черный



Кто не делится найденным, подобен свету в дупле секвойи (древняя индейская пословица)

Яндекс посчитал живые и устаревшие слова в словаре Даля

Яндекс посчитал живые и устаревшие слова в словаре Даля

Содержание

    Прикол, клубняк и порно: слова из словаря Даля в поисковых запросах к Яндексу

    Аналитики Яндекса сравнили слова из «Толкового словаря живого великорусского языка» В.И. Даля со словами, которые встречались в поисковых запросах к Яндексу в течение последнего года. Это позволило проследить, как изменилась лексика русского языка за полтора века — первое издание четырёхтомника вышло в 1863–1866 гг.

    В наше время продолжают использоваться 60% слов из словаря, то есть примерно 2,5 тома. Около половины из них — живые слова: к ним постоянно прибегают при поиске. Вторая половина — «уходящие»; они либо появляются в запросах крайне редко, либо люди ищут их в основном для того, чтобы узнать значение: [хлудец это], [что такое прокоробить].

    Оставшиеся 40% слов можно признать ушедшими. Они практически полностью вышли из употребления: пользователи в течение года ничего не искали с их помощью и даже не спрашивали, что они означают.

    Некоторые слова из словаря встречаются в запросах, однако их современное значение не имеет ничего общего с приведённым у Даля. Это, например, слова «порно», «двач», «клубняк» и «прикол». У Даля «порно» — наречие со значением «крепко, надёжно, дюже, прочно, споро». «Двач» — «предмет, состоящий как бы из срослых двойней, близнят». «Клубняк» — «вообще всё клубоватое, образующее клубки». «Прикол» — существительное, обозначающее действие по глаголу «прикалывать».

    Яндекс составил карту России, на которой для каждого региона показаны десять самых характерных слов из словаря Даля. Эти слова здесь искали намного чаще, чем в среднем по стране. Часть из них употребляются в значении, приведённом Далем, а часть — омонимы: названия местных организаций, населённых пунктов и улиц, имена и фамилии.

    Цифры и факты

    • В словаре Даля даны толкования около 200 тысяч слов — количество обычно оценивают примерно. Сам Даль называл такие слова красными. В словаре красные слова организованы в гнёзда, которых насчитывается чуть больше 40 тысяч.
    • За год Яндекс ответил примерно на 70 млрд запросов из России. В них встречается больше 285 млн разных «слов». Далеко не все из них настоящие: часть написаны с опечатками или в неправильной раскладке, а часть — непонятные последовательности букв.
    • Чтобы отсеять несуразицу, Яндекс сравнил слова из запросов со словами из Национального корпуса русского языка. В нём оказалось 840 тыс. слов, причём 130 тыс. из них не упоминаются в запросах — это некоторые топонимы и слова, выдуманные писателями.

     

    Полная версия исследования: https://yandex.ru/company/researches/2016/ya_dahl

    Тест «Угадайте значение слова» — поможет проверить, отличаете ли вы маламзю от фалбалы, а журапки — от кабатеек.

    29.11.2016, 425 просмотров.


    Уважаемые посетители! С болью в сердце сообщаем вам, что этот сайт собирает метаданные пользователя (cookie, данные об IP-адресе и местоположении), что жизненно необходимо для функционирования сайта и поддержания его жизнедеятельности.

    Если вы ни под каким предлогом не хотите предоставлять эти данные для обработки, - пожалуйста, срочно покиньте сайт и мы никому не скажем что вы тут были. С неизменной заботой, администрация сайта.

    Dear visitors! It is a pain in our heart to inform you that this site collects user metadata (cookies, IP address and location data), which is vital for the operation of the site and the maintenance of its life.

    If you do not want to provide this data for processing under any pretext, please leave the site immediately and we will not tell anyone that you were here. With the same care, the site administration.