Сообщения

Сообщения за май, 2025

Практическое задание №5. Автоматизированный кластерный анализ

Изображение
 Я использовала тексты о метеоритах.  С1 - это текст про падение Челябинского метеорита и его последствия для города. С2 - о том, как искали Челябинский метеорит, интервью с дайверами. С3 - о том, что такое метеориты и об их особенностях. С4 - предположу, что их объединили в одну группу, так как в обоих упоминается Челябинский метеорит, но ещё даётся научная справка о метеоритах и истории о падении других метеоритов. С5 - о падении метеорита в Алабаме. С6 - о падении метеорита в Техасе. При изменении уровня кластеризации, то есть перемещении вертикального разделителя вправо - количество групп увеличивается, влево - уменьшается. 

Практическое задание №8. Network-анализ

Изображение
 Я выбрала базу данных lastаfm.net, основной параметр - listeners.  1) Наиболее важные связи: rock (хаки), pop (мятный), indie (серо-голубой). Доминирующий тип контента: "Other". 2) Центральный элемент связей - rock (кружок цвета хаки). 3) Наиболее удобная модель - Network Explorer, в ней тип контента разделяется по цвету, размеру, количеству и формам. Можно определить взаимосвязи контента между собой. MDS неудобен тем, что много условных обозначений накладываются друг на друга, перекрывая обзор.

Практическое задание №7. Графический анализ с кластеризацией и алгоритмом N-SNE

Изображение
 Для анализа я выбрала 10 фото с изображением собак. 1) Модель Image Grid разделила по формату изображений (соотношение сторон друг к другу) и по цвету. Модель очень удобна, так как показывает сами изображения на схеме. Модель t-SNE разделила картинки по принципу цветовой палитры и крупности объекта на картинке. Модель Hierarchical Clustering мне показалась наиболее точной. Она разделил картинки по принципу того, что на них изображено, по цвету и по крупности объекта на картинке. И так как "бежевый" отнесла к группе C2 рядом с С3, могу предположить, что разделила по схожести пород собак. 2) Я выбрала "зеленый, голубой, розовый, красный, желт. звездочка" крупное изображение собак одной породы одного цвета в цветных шапках. "Бежевый" и "коричневый" выбирала как вертикальное изображение. "Фиолет", "желтый цветочек" и "крутые" выбирала как картинки, отличные от предыдущих с средней крупностью объекта на картинке.  Три мо...

Практическое задание №9. Регрессионный анализ с линейной проекцией и моделью SVM

Изображение
Для анализа я выбрала коэффициент смертности от самоубийств (на 100 тыс. населения) в России и США с 2000 по 2021 гг. Вывод: анализ взаимосвязи двух групп данных показал, что они никак не связаны, показатели почти никак не пересекаются. На всех моделях это отчетливо видно.  Наиболее наглядными оказались Linear Projection и Polynominal Regression.