Практическое задание №4. Автоматизированный контент-анализ с моделью текста
Для анализа я выбрала два текста:
По word cloud можно составить представление о чём будет статья. Word cloud разделяет слова на главные и второстепенные. По большим словам можно сразу определить о чем текст, маленькие дополняют.
статья Кинопоиска о прошедшей премии Оскар (https://www.kinopoisk.ru/media/news/4010790/)
статья Кинопоиска о предстоящем сериале про Гарри Поттера (https://www.kinopoisk.ru/media/news/4010811/).
Текст про Оскар
Текст про Гарри Поттера
По модели текста можно понять, что это за статья, только если знать заранее. Модель текста не отражает содержание текста, так как выделяет ключевые слова, в том числе предлоги, которые составляют половину ключевых слов.
По методике Word cloud легче определить тематику текстов.
.png)
.png)
.png)
.png)
Комментарии
Отправить комментарий