беЛн.бу - Белорусский, народный портал





Реклама

Купить ссылку здесь за руб.Поставить к себе на сайт

Вход на портал

Для просмотра профиля, войдите на портал как пользователь.

Меню портала

Календарь

Погода

GISMETEO: Погода по г.Минск
Погода в других городах

Категории раздела

Интернет и СМИ [4054]
Технологии, Техника и наука [5870]
Общество [31]
Происшествия [695]
Кино [1395]
Медиа [81]
Игры [897]
Музыка [608]
О кино [142]
О кино для "VIP" [0]
Иное [48]
Разное [610]
Навины.БУ [3097]
Общество, Происшествия и т.д.
Общество (СБ) [647]
Спорт (СБ) [96]
Происшествия (СБ) [186]
Программа телепередач [35]
На неделю
Белорусская нива (БН) [82]
Общество, происшествия, Пульс: события и факты и т.д.
Кино, мультфильмы, сериалы и т.д. В Онлайне [60]

Реклама



Полезные ссылки

Статистика портала



соц.сети

Облако тегов

Мы принимаем

ТОП РЕЙТИНГ

Главная » 2016 » Февраль » 23 » Математики проверили на прочность закон Ципфа
13:37
Математики проверили на прочность закон Ципфа


Испанские математики проверили на прочность закон Ципфа, согласно которому при попытке упорядочить все слова языка или текст по убыванию частоты их использования частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n. О результатах исследования рассказывается в свежем выпуске журнала PLOS ONE.

Для того чтобы определить правильность закона Ципфа, исследователи решили использовать его применительно к проекту «Гутенберг» — инициативе по созданию и распространению электронной универсальной библиотеки, которая включает 31075 книг на английском языке. Прежние попытки применить закон Ципфа ограничивались десятками текстов, а теперь исследователи работали с настоящим массивом данных.

Ученые поставили перед собой задачу определить, вписываются ли тексты в закономерность, согласно которой второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее. Таким образом, ими была избрана простейшая формулировка закона Ципфа.

Согласно итогам исследования, при условии, что опущены наиболее редкие и архаичные формы слов, порядка 55 процентов текстов вписываются в закон Ципфа. Если учитывать эти слова, то соответствие закономерности снижается до 40 процентов.

Лингвист Джордж Кингсли Ципф исследовал частотность слов: одних в тексте попадается больше, других меньше, и по этому принципу все слова разбиваются на группы. Ученый предложил дать этим группам порядковые номера (ранги): самые частотные слова получают номер 1, с частотностью пониже — 2, еще на уровень ниже — 3, и так далее.

После этого вычисляется вероятность встретить слово Икс в тексте: количество слов Икс в тексте делится на число всех слов. Ципф обнаружил, что если вероятность для слова Икс помножить на порядковый номер ранга, в котором оно оказалось, то каждый раз будет получаться приблизительно одна и та же величина. Так, для английского языка эта константа равна примерно 0,1, а для русского — 0,06-0,07.


Прямые ссылки:

  • - ссылка
  • - BBCode
  • - HTML

  • Категория: Технологии, Техника и наука | Просмотров: 133 | Добавил: rinhed | Теги: Новости, на прочность, беЛн, Ципфа, закон, математики, проверили | Рейтинг: 0.0/0
    Всего комментариев: 0
    Добавлять комментарии могут только зарегистрированные пользователи.
    [ Регистрация | Вход ]

    Корзина

    Ваша корзина пуста

    Переводчик

    Выберите язык портала

    Поиск по порталу

    Поиск от яндекс

    Доска объявлений

    В настоящий момент нет VIP объявлений. Станьте первыми!

    Видео

    Розыск: в Минске мужчин...

    00:00:41
    0 0 0.0

    Горящий мусоровоз приех...

    00:00:24
    0 0 0.0

    Появилось видео попытки...

    00:02:02
    0 0 0.0

    Милиция ищет мужчину, н...

    00:00:23
    0 0 0.0

    EMOTION - Почему

    00:03:42
    1 0 5.0

    Получить бонус

    Еще бонусы тут

    Моментальный обмен WebMoney

    Вы можете получить WMR-бонус в размере 0,01-0,10 WMR на свой кошелек 1 раз в сутки

    Кошелек
    Код Защитный код

    Обмен Webmoney

    Бонус

    BAKSGRAD.RU
    Обновить Код.

    Архив