Узнайте, насколько хорошо вы разбираетесь в группировке и классификации данных. Наш тест поможет вам проверить свои знания и навыки в этой важной области. Проверьте себя и узнайте, как эффективно вы можете группировать информацию для анализа и принятия решений.
1. Что такое кластерный анализ?
a) Метод прогнозирования данных
b) Метод группировки данных на основе сходства +
c) Метод оценки качества данных
2. Какой алгоритм используется для разделения данных на группы?
a) Линейная регрессия
b) Метод k-средних +
c) Логистическая регрессия
3. Какое свойство используется для определения сходства между объектами в кластерном анализе?
a) Расстояние между объектами +
b) Время обработки данных
c) Объем данных
4. Что такое дендрограмма?
a) График распределения данных
b) Дерево кластеров, показывающее иерархию групп +
c) Таблица частот
5. Какой метод кластеризации использует иерархический подход?
a) Метод k-средних
b) Иерархическая кластеризация +
c) Метод главных компонент
6. Что такое центроид в контексте кластеризации?
a) Среднее значение всех данных
b) Центральная точка кластера +
c) Максимальное значение в данных
7. Какой метод используется для оценки качества кластеризации?
a) Метод k-средних
b) Метод силуэта +
c) Метод главных компонент
8. Что такое DBSCAN?
a) Алгоритм кластеризации на основе плотности +
b) Метод линейной регрессии
c) Алгоритм кластеризации на основе расстояния
9. Какой параметр используется в DBSCAN для определения радиуса поиска соседей?
a) Epsilon +
b) Kappa
c) Sigma
10. Что такое аномалия в контексте кластеризации?
a) Объект, не принадлежащий ни одному кластеру +
b) Объект, принадлежащий всем кластерам
c) Объект, принадлежащий только одному кластеру
11. Какой метод используется для визуализации кластеров в двухмерном пространстве?
a) t-SNE +
b) Линейная регрессия
c) Метод главных компонент
12. Что такое дисперсия в контексте кластеризации?
a) Мера разброса данных внутри кластера +
b) Мера разброса данных между кластерами
c) Мера разброса данных по всей выборке
13. Какой метод используется для снижения размерности данных перед кластеризацией?
a) Метод главных компонент +
b) Метод k-средних
c) Метод силуэта
14. Что такое метрика силуэта?
a) Мера качества кластеризации +
b) Мера расстояния между кластерами
c) Мера разброса данных внутри кластера
15. Какой параметр используется в методе k-средних для определения количества кластеров?
a) K +
b) Epsilon
c) Sigma
