Web-studio46.ru

Обучение и образование
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Анализ ципфа онлайн

Анализ и оценка удобочитаемости и естественности текста

Описание

Сервис позволяет определить такие качественные показатели текста как удобочитаемость и естественность.

Удобочитаемость текста

Данный параметр раскрывается через два индекса: фог-индекс и индекс Флеша.

Фог-индекс (Индекс туманности Ганнинга)

Фог-индекс обычно используется для подтверждения легкости чтения предполагаемой аудиторией. Тексты для широкой аудитории, как правило, требуют индекса туманности менее 12, тексты для детей нуждаются в индексе менее 8. Научные публикации имеют индекс 20 и выше, такие тексты очень трудно понять без специальной подготовки.

В нашем сервисе данный коэффициент рассчитывается с некоторыми особенностями:

Для расчета используются все слова, а не выборка из 100 слов.

Учитываются сложносочинённые предложения, они считаются за два предложения.

Используется поправочный коэффициент 0,78 для русских текстов.

При подсчете сложных слов не учитываются составные слова и имена собственные, а глаголы ставятся в начальную форму. Сложные слова — это слова из трёх или более слогов.

Индекс Флеша

Еще один индекс для определения сложности восприятия текста. Изначальная формула применяется для английского языка, в нашем сервисе используется адаптированная версия для русского языка.

Индексы удобочитаемости имеют ограничения, так как на трудность восприятия сильнее всего оказывают влияние семантика и абстрактность текста.

Естественность текста

Следующая группа показателей позволяет сделать оценку текста с точки зрения злоупотреблений ключевыми словами и фразами, которые могут повлиять на признание текстов поисковым спамом.

Общая естественность текста по Ципфу

Данный показатель рассчитывается по закону Ципфа. Частотность слов в тексте распределяется по статистическому закону — то есть обратно пропорционально рангу в тексте (ранг — это порядковый номер слова в списке, который составлен по убыванию частотности слов в тексте).

Общая естественность расшифровывается подробной таблицей, где показывается ранг слов в тексте, их частотность и отклонения от нормы. Даны рекомендации о необходимых изменениях в тексте для увеличения его естественности. Если данный показатель больше 50, то текст вполне естественный. Желательно поднимать данный показатель до 80 или выше.

Академическая тошнота

Данный показатель рассчитывается по всем часто повторяющимся словам, показывает общую загруженность текста повторами слов. При написании текстов, не рекомендуется превышать данный показатель выше 40%.

Классическая тошнота

В отличие от предыдущего показателя, данный рассчитывается по одному, самому часто повторяемому слову. Желательно писать тексты с показателем ниже 7, а лучше ниже 3.

Также в сервисе «Анализ и оценка удобочитаемости и естественности текста» приводятся общие статистические показатели текста, которые используются при расчетах.

SEO-анализ текста:

Подсчет слов в тексте и количество знаков.

Счетчик символов: подсчет количества знаков и слов в тексте онлайн.

Счетчик позволяет, без дополнительных действий, посчитать число слов в тексте, а также количество символов с пробелами и без них.

Читать еще:  Редактирования текста онлайн

Семантический анализ онлайн позволяет провести расширенное исследование текста.

На Семантический анализ принимается текст длиной от 100 слов до 10 000 символов не содержащий HTML код.

Данный сервис является частью инструмента SEO Анализа страницы сайта и не имеет возможности по обработки HTML кода.

Определение заспаммености «Водности» текста:

Процентное определение от общего количества слов и слов отфильтрованных по нашей базе стоп-слов которые не несут смысловой нагрузки в статье.

Определение «Тошноты» Заспамленность текста:

Классическая тошнота: . Стоит придерживаться рамок от 3 до 7

Академическая тошнота: Оптимальным показателем будет от 4 до 7

Заспамленность текста: превышение ключевых слов к общему текста

Анализ текста по закону Ципфа

Качество естественности текста рассчитывается по количеству частых повторов слов или групы слов упорядоченные по уменьшению частоты их использования.

Закон Ципфа («ранг—частота») — эмпирическая закономерность распределения частоты слов естественного языка: если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n (так называемому рангу этого слова, см. шкала порядка). Например, второе по используемости слово встречается примерно в два раза реже, чем первое, третье — в три раза реже, чем первое, и так далее. ( Материал из Википедии ).

  1. Слово — слово или словоформы
  2. Повторов — количество найденное в тексте
  3. По Ципфу — величина согласно Ципфу
  4. Соответствие — процентное отношение количества повторов и норме по Ципфу
  5. Плотность — процентное отношение к общему количеству слов ( без стоп-слов )
  6. Рекомендации — добавить или убавить количество вхождений

Сводная таблица статистики текста.

СТАТИСТИКА ТЕКСТА: Всего символов, Без пробелов, Количество слов, Естественность текста, Заспамленность, Вода, Уникальных слов, Ключевых слов, Стоп-слов.

ПОДСВЕТКА: Выделение воды и заспаменности в тексте — визуально помогает определить вхождение частоты слов в статье и делает интерактивным и понятным для анализа.

Сервис носит исключительно информационный и ознакомительный характер.

Как закон Ципфа влияет на место страницы в выдаче

Студентка курса «Основы копирайтинга» Юлия Хлебко рассказала, что такое закон Ципфа, проверила тексты из выдачи и объяснила, стоит ли применять правило на практике.

Что такое закон Ципфа

Сложно. Закономерность распределения частоты слов естественного языка. Если все слова языка или длинного текста упорядочить по убыванию частоты использования, частота n-го слова в списке окажется обратно пропорциональной его порядковому номеру n.

Просто. Самое распространенное слово в тексте встречается:

  • в два раза чаще, чем второе по частоте слово;
  • в три раза чаще, чем следующее слово;
  • и далее до наименее частого.
Читать еще:  Онлайн курсы по подбору персонала

Зачем применяют закон Ципфа

В лингвистике. Закон использовали для описания разных данных, например, доходов населения и распределения роста городов. Джозеф Ципф применил его, чтобы проанализировать распространенность слов в английском языке.

В SEO. Правило используют, чтобы проверить естественность SEO-текстов. Предполагается, что в естественной речи частота слов соответствует закону Ципфа. Если повторы слов в тексте для продвижения не соответствуют пропорции, статья неестественная. Поисковой робот может расценить ее как заспамленную и понизить в выдаче.

Работает ли закон Ципфа на практике

Дано:

  • первый текст из поисковой выдачи;
  • 39 текст в поиске;
  • контрольный текст Максима Ильяхова.

Инструменты:

Результаты

Первый текст из выдачи


miratext.ru — 67%


pr-сy.ru/zypfa — 83%


seоlik.ru/zipfa — 61%

39-й текст из выдачи


miratext.ru — 56%


pr-сy.ru/zypfa — 84%


seоlik.ru/zipfa — 53%

Контрольный текст Максима Ильяхова


miratext.ru — 52%


pr-сy.ru/zypfa — 85%


seоlik.ru/zipfa — 54%

Нужно ли подгонять тексты по закону Ципфа

Показатели первого, 39-го текста и статьи Максима Ильяхова при проверке в одном сервисе отличаются несущественно. Зато результаты разных инструментов отличаются почти в два раза. Ни один сервис не дает объяснения проверки, алгоритмы подсчета тоже остаются неизвестными.

Поэтому закон Ципфа не стоит рассматривать как панацею, которая поможет вывести текст в топ. Инструмент можно использовать для проверки, но бездумно подгонять под него статью неэффективно. Вместо этого целесообразнее уделить внимание качеству текста в целом:

  • убрать словесный мусор — воду, повторы, отклонения от темы, штампы, канцеляризмы;
  • проработать структуру — написать текст так, чтобы читателю было легко в нем ориентироваться и понимать;
  • заменить общие рассуждения фактами, статистикой;
  • добавить скриншоты, иллюстрации ваших слов, схемы и другую графику, которая сделает текст нагляднее;
  • написать текст с пользой — подробно раскрыть тему, чтобы у читателя не осталось вопросов.

Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Закон Ципфа

Среди критериев оценки качества текста основным считается его естественность. Проверку этого показателя можно провести с помощью математического метода, который обнаружил американский лингвист Джордж Ципф.

Проверка по закону Ципфа — это метод оценки естественности текста, определяющие закономерность расположения слов, где частота слова обратно пропорциональна его месту в тексте.

Первый закон Ципфа «ранг — частота»

Второй закон Ципфа «количество — частота»

Проверить SEO-текст на естественность нужно обязательно, если при написании использовались ключевые слова, чтобы он был интересным и понятным для большой аудитории читателей. Также этот показатель имеет значение при ранжировании сайтов поисковыми системами, которые определяют соответствие текста ключевым запросам, распределяя слова по группам важных, случайных и вспомогательных.

  • Зависимость между частотой встречаемости слова в тексте f, и его местом в частотном словаре (рангом) r, обратно пропорциональная. Чем больше ранг слова (чем дальше оно находится от начала словаря), тем меньше частота его встречаемости в тексте.
  • График такой зависимости — гипербола, которая при небольших значениях рангов очень резко спадает, а затем, в области малых значений частоты встречаемости, f, тянется очень далеко, постепенно, но очень незаметно, уменьшаясь по мере роста ранга, r.
  • Если частота встречаемости одного слова 4 на миллион, а частота другого — 3 на миллион, не имеет значения, что ранги этих слов различаются в тысячу раз. Эти слова употребляются настолько редко, что многие носители языка их даже не слышали.
  • Однако эта дальняя область примечательна тем, что слово, находящееся здесь, может очень легко многократно уменьшить значение своего ранга. Даже самое маленькое увеличение частоты встречаемости слова резко сдвигает его положение к началу частотного словаря.
  • В терминах этого закона мерой популярности слова является его положение в частотном словаре языка. Более популярное слово находится ближе к началу словаря, чем менее популярное.
  • Он отражает зависимость частоты использования слова в языке от его места в частотном словаре. Популярные слова языка употребляются чаще. С математической точки зрения, график этой зависимости является гиперболой с резким подъемом по мере приближения к началу координат и длинным, пологим, почти горизонтальным, «хвостом». БОльшая часть слов языка размещается именно в этом «хвосте». Здесь место слова в частотном словаре, если и изменяет частоту использования этого слова в языке, то совсем не на много.
  • Но как только положение слова в частотном словаре достигает того места на гиперболе, где по мере приближения к началу координат начинается существенный подъем кривой, ситуация изменяется. Теперь небольшое изменение частоты встречаемости слова уже не приводит к значительным изменениям его ранга, то есть положение слова в частотном словаре перестает изменяться. Значит, рост популярности слова затормозился. Для того, чтобы он продолжался, следует предпринять специальные меры для того, чтобы повысить частоту встречаемости слова. Например, если слово – название товара, необходимо потратить средства на рекламную компанию (источник: http://www.proza.ru/2016/11/05/859)
Читать еще:  Онлайн курсы по копирайтингу

Провести проверку естественности текста Вы сможете в нашем приложении «Анализ текста».

Рекомендуем посмотреть видео по теме.

Ссылка на основную публикацию
Adblock
detector