Математика для анализа данных.дпо
1. Data Mining — это процесс обнаружения в сырых данных…*ранее сформулированных гипотез
* неочевидных закономерностей
*практических закономерностей
*объективных закономерностей
*большого количества закономерностей
2. R2 –это*коэффициент множественной корреляции
* коэффициент множественной детерминации
*частным коэффициентом корреляции
3. Алгоритм k-средних предназначен для решения задачи:*Классификации
* Кластеризации
*Прогнозирования
*Снижения размерности
4. Большие данные – это:*Данные объемом более 10Тб
*Данные объемом более 100Тб
*Данные объемом более 150Тб
*Нет ограничений на минимальный объем
5. Большинство методов Data mining были разработаны в рамках …*классического анализа данных
*теории баз данных
*теории искусственного интеллекта
6. В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом:*В гистограмме с группировкой
*В нормированной гистограмме
* В гистограмме с накоплением
7. В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом:*В гистограммах с группировкой
* В гистограммах с накоплением
*В объёмных гистограммах
8. В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом:*В объёмных гистограммах
* В гистограммах с группировкой
*В гистограммах с накоплением
9. В процессе работы Data Mining программы пользователь может получить:*рый процент недостоверных результатов
*только верные результаты, ложные выводы исключены
* только статистически достоверные результаты
10. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары* согласованы
*несогласованы
*коррелированны
*некоррелированны
11. Выбор в электронной таблице данных, соответствующих определенным условиям:*Сортировка
*Анализ
* Фильтрация
12. Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин:* Диаграмма
*Статистика
*Инфографика
13. Деревья решений относятся к группам …*статистических методов
*кибернетических методов
*логических методов
*методов кросс-табуляции
14. Для какой шкалы применимы только такие операции как равно и не равно?* номинальная шкала
*порядковая шкала
*интервальная шкала
15. Доверительный интервал это-*интервал от минимального до максимального значения признака
*среднеквадратическое отклонение
* интервал, содержаний оцениваемый параметр генеральной совокупности
*стандартная ошибка среднего
16. Значение коэффициента корреляции расположены в диапазоне* от -1 до +1
*от 0 до +1
*от 0 до -1
*от -2 до +2
17. Значимость множественной корреляции оценивается по*критерий Пирсона
* критерий Фишера
*критерий Лапласа
*критерий Романовского
18. Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что* линейная связь между случайными величинами и отсутствует
*случайные величины и линейно зависимы
*случайные величины и зависимы
*случайные величины и независимы
* если случайный вектор является гауссовским, то случайные величины и независимы
19. Интервальная шкала – это шкала…*содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла
*разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла
*содержащая только категории, которые не могут упорядочиваться
20. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы:* К круговым диаграммам
*К циклопическим диаграммам
*К спектральным диаграммам
21. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:*программное обеспечение
*оборудование
*социальные сети
*сервисные услуги
* СУБДД
22. Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах:*Гистограмма с накоплением
*Гистограмма с группировкой
* Нормированная гистограмма с накоплением
23. Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально:*Пропорциональная диаграмма
* Линейчатая диаграмма
*Гистограмма
24. Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин:* Диаграмма
*График
*Таблица
25. Какая функция в R возвращает количество знаков в строке x?*format(x)
*paste(…)
*tolower(x)
* nchar(x)
26. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?*format(x)
* paste(…)
*tolower(x)
*nchar(x)
27. Какая функция в R приводит строку к нижнему регистру?*format(x)
*paste(…)
* tolower(x)
*nchar(x)
28. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?* format(x)
*paste(…)
*tolower(x)
*nchar(x)
29. Какие диаграммы аналогичны гистограммам:* Линейчатые
*Лепестковые
*Круговые
30. Какие диаграммы можно использовать для построения графиков функций:* Точечные
*Лепестковые
*Поверхностные
31. Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций:*Линейчатые диаграммы
*Нормированные гистограммы с накоплением
* Точечные диаграммы
32. Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных:* Круговые диаграммы
*Линейчатые диаграммы
*Гистограммы с накоплением
33. Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции:*множественные коэффициенты детерминации;
*коэффициенты множественной корреляции;
* частные коэффициенты детерминации.
34. Какие типы данных используются в R:*logical
*numeric
*integer
*attributive
*complex
* character
35. Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени:*Циклическая гистограмма
*Круговая диаграмма
* График
36. Какой вид связи изображен на рис 1..*обратно пропорциональная связь
*вязь отсутствует
*прямо пропорциональная связь
*связь нелинейная
37. Какой пакет позволяет загружать данные из листа Excel файла?*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
38. Какой пакет позволяет загружать данные из листа Excel файла?*readxl
* excelreadr
*googlesheets
*vroom
*sheets_read
39. Классификация относится к стратегии:* обучения с учителем
*обучения без учителя
*обучения с подкреплением
40. Кластер можно охарактеризовать как …*группу объектов, имеющих общие свойства
*один объект, изолированный от других
*группу объектов, имеющую внутреннюю однородность
41. Корреляционное отношение изменяется в пределах*от -1 до +1
* от 0 до +1
*от 0 до -1
*от -2 до +2
42. Коэффициент вариации определяется по формуле:*1
*2
* 3
*4
43. Кто создал первую модель искусственных нейронных сетей?*Фрэнк Розенблатт
* Уоррен Мак-Каллок и Уолтер Питтс
*Ян Лекун
*Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
44. Метод наименьших квадратов может применяться в случае*только парной регрессии
*только множественной регрессии
* нелинейной и линейной множественной регрессии
*коллинеарной регрессии
45. На какой вкладке размещены инструменты сортировки в Microsoft Excel:*Вставка
*Вид
* Данные
46. Найдите соответствие между функцией в R и еe описанием:A. str(оbject)
B. summаry(оbject)
C. hеad(x)
D. tаil(x)
E. Внутренняя структура объекта
F. Общая информация об объекте
G. Посмотреть начальные строки объекта
H. Посмотреть последние строки объекта
47. Найдите соответствие между функцией в R и еe описанием:A. с(…)
B. sеq(from, to, by=)
C. list(…)
D. сbind(…)
E. Объединяет аргументы в вектор
F. Генерирует последовательность чисел с шагом
G. Создает список объектов
H. Объединяет объекты по столбцам
48. Не верно утверждение о том, что:*Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных
*Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации
*Удешевление систем хранения на единицу информации привело к росту рынка больших данных
*Большое разнообразие источников данных
49. Не верно утверждение о том, что:* Большие данные это данные объёма свыше 1 Тб.
*Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.
*Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.
*Большие данные как правило не структурированы.
50. Не верно, что Variety в контексте характеристик Big Data означает:* Высокая скорость генерирования данных
* Разные типы данных в колонках таблиц реляционных СУБД
* Разнообразие отраслей, являющихся источниками данных
*Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные
51. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:* быть очевидными
*быть неочевидными
* быть практически полезными
*быть объективными
52. Не верно, что технология Web Mining применяет Data Mining для анализа:*Неоднородной информации
*Неструктурированной информации
*Структурированной информации
*Распределенной и значительной по объему информации
53. Некоррелированность случайных величин означает*отсутствие любой связи между ними
* отсутствие линейной связи между ними
*их независимость
54. Объём накопленных человечеством цифровых данных на 2023 год измеряется:*Петабайтами
*Зеттабайтами
*Экзабайтами
*Йоттабайтами
55. Один из объектов любой диаграммы:*Границы диаграммы
* Область диаграммы
*Очертания диаграммы
56. Один из объектов любой диаграммы:*Сущность диаграммы
*Вид диаграммы
* Название диаграммы