Инструменты анализа данных.дпо
1. По какому признаку классифицируются методы прогнозирования на два основных класса?* по источнику информации
*по математическому методу применения
*по объему информации
*по способу представления
2. Модели последовательностей описывают …правила или набор правил, в соответствии с которыми можно отнести описание любого нового *объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
3. Общий алгоритм завершается:*численными расчетами
*созданием графических моделей
*морфологическим анализом
*естественной детализацией дальнейших исследований
4. Что такое участок упреждения в прогнозировании?*участок, на который «опирается» прогноз
*участок времени предыстории
*участок «обучения» выборки исходных данных
*участок, на который строится прогноз
5. Кластеризация — …*это установление зависимости непрерывной выходной переменной от входных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной отвходных переменных
6. В описательных моделей относятся следующие модели данных:*модели классификации и последовательностей
*регрессивные, кластеризации, исключений, итоговые и ассоциации
*классификации, кластеризации, исключений, итоговые и ассоциации
*модели классификации, последовательностей и исключений
7. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (10;3), а второе (3;1). Можно сказать, что эти пары*согласованы
*несогласованы
*коррелированны
*некоррелированны
8. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары*согласованы
*несогласованы
*коррелированны
*некоррелированны
9. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (7;3), а второе (3;5). Можно сказать, что эти пары*согласованы
*несогласованы
*коррелированны
*некоррелированны
10. Обогащение— …*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
11. Задача кластеризации заключается в …*нахождения частых зависимостей между объектами или событиями
*определения класса объекта по его характеристиками
*определение по известным характеристиками объекта значение некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
12. Задача регрессии сводится к …*нахождения частых зависимостей между объектами или событиями;
*определения класса объекта по его характеристиками
*определение по известным характеристиками объекта значения некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
13. Информационные технологии обработки данных предназначены…*для решения хорошо структурированных задач, по которым имеются необходимые входные данные и известны алгоритмы и другие стандартные процедуры их обработки
*для решения неструктурированных задач
*для передачи данных в системе управления
*для решения хорошо структурированных задач, по которым нет необходимых входных данных и неизвестны алгоритмы и другие стандартные процедуры их обработки
14. Объяснение результатов обработки данных – это …*визуализация
*апробация
* интерпретация
*экстраполяция
15. Итоговые модели обнаружат …*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.
16. Чем оценивается точность прогноза?*величиной доверительного интервала для заданной вероятности
*расхождением между наблюдаемыми и вычислительными величинами
*вероятностью осуществления прогноза в заданном интервале
*разницей между рассчитанными разными методами величиной
17. Как называется графическое представление результатов обработки данных?*корреляция
*визуализация
*интерполяция
*экстраполяция
18. Транзакция — …*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процессаанализа данных целостность, обеспечивает, непротиворечивость ихронологию данных, а также высокую скорость выполнения аналитическихзапросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
*это установление зависимости дискретной выходной переменной от входных переменных
19. Как подразделяются прогнозы по виду представления?*на интервальные и точечные
*на поисковые и нормативные
*на экономические, социальные и др.
*на графические и табличные
20. Какой из модулей ППП Статграфикс входит в состав базовых?*контроль качества
*сравнение данных
*планирование эксперимента
*многомерные методы
21. Какой модуль ППП Статграфикс определяет экстремум функции отклика исследуемой системы?*описания данных
*планирование эксперимента
*сравнение данных
*анализ временных рядов
22. Какую проблему не решают задачи кластеризации, отыскивая "скрытую структуру" исследуемых данных и не имея опорной целевой переменной?*разметка данных "вручную" очень дорого и трудозатратно
*построение признаков из очень большего количества данных
*возможность отслеживать эволюционные изменения
*поиск выбросов и шумов в исследуемых данных
23. Кластеризация — …*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
24. Консолидация— …*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
25. Метаданные — …*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процессаанализа данных целостность, обеспечивает, непротиворечивость ихронологию данных, а также высокую скорость выполнения аналитическихзапросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
это установление зависимости дискретной выходной переменной от входных переменных
26. Аналитик это …*специалист в области анализа и моделирования
*специалист в предметной области
*человек, решающий определенные задачи
*человек, который имеет опыт в программировании
27. Под методом понимается*алгоритм решения нетиповой задачи по заданной постановке
*алгоритм решения типовой задачи по незаданной постановке
*алгоритм решения типовой задачи по заданной постановке
*алгоритм решения нетиповой задачи по незаданной постановке
28. Метод главных компонент – это метод…*дисперсионного анализа
*факторного анализа
*кластерного анализа
*регрессионного анализа
29. Модели ассоциации проявляют …*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.
30. Модели классификации описывают …*правила или набор правил в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
31. Аналитическая платформа — …*специализированный программный решение (или набор решений),который включает в себя все инструменты для извлечения закономерностей из сырых данных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*набор данных, каждая запись которого представляет собой учебный пример, содержащего заданный входной влияние, что и отвечает емуправильный выходной результат
*подразделение искусственного интеллекта изучающий методы построения алгоритмов, способных обучаться на данных
32. Модуль Статграфикс «анализ временных рядов» позволяет обрабатывать…*трехмерный массив данных
*двухмерный массив данных
*одномерный массив данных
*четырехмерный массив данных
33. Основная задача кластеризации:*отыскать "скрытую структуру" данных
*разделить набор данных на предопределенные классы
*определить центр набора данных
*упорядочивание объектов в статистически однородные группы
34. Очистка данных — …*комплекс методов и процедур, направленных на устранениепричин, мешающих корректной обработке: аномалий, пропусков,дубликатов, противоречий, шумов и т.д.
*процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач
*объект, содержащий структурированные данные, которые могут оказаться полезными для развязки аналитической задачи
*комплекс методов и процедур, направленных на извлечение данных изразличных источников, обеспечение необходимого уровня ихинформативности и качества, преобразования в единый формат, в котором они могут быть загружены в хранилище данных или аналитическую систему
35. Выберите алгоритм, который не решают задачи кластеризации*K-средних
*Деревья решений
*EM-алгоритм
*К-медиан
36. Дисперсионный анализ предназначен для…*выбора закона распределения переменной
*прогнозирования переменной
*обнаружения влияния выделенного набора факторов на отклик исследуемой системы
*кластеризации данных
37. При построении математической модели возникает следующая проблема:*определение числа параметров модели
*определение значений параметров модели
*выбор структуры модели
*выбор критерия оценки качества модели
38. Регрессивные модели описывают …*правила или набор правил в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
39. Для построения гистограммы данных необходимо задать …*величину периода упреждения
*число факторов
*число целевых функций
*число интервалов группирования
40. Регрессивные модели описывают …*правила или набор правил, в соответствии с которыми можно отнести описание любого нового объекта к одному из классов
*функции, которые позволяют прогнозировать изменения непрерывных числовых параметров
*функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа
41. Кластерный анализ позволяет…*построить прогноз
*построить регрессионную модель
*выбрать закон распределения
*разбить данные на классы
42. Регрессия — …*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
43. Доверительный интервал прогноза растет с:*с увеличением периода упреждения прогноза
*с увеличением периода ретроспекции прогноза
*с уменьшением доверительной вероятности
*с уменьшением С.К.О. прогноза
44. Регрессия — …*установление зависимости непрерывной выходной переменной отвходных переменных
*группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*установление зависимости дискретной выходной переменной от входных переменных
45. К какой группе относится ППП Статграфикс?*специализированный
* универсальный
*профессиональный
*фундаментальный
46. На какие два изначальных класса подразделяются методы прогнозирования?*на математические и описательные
*на фактографические и экспертные
*на графические и символические
*на точечные и интервальные
47. У каждого из n объектов измеряется большое количество показателей. Требуется без нарушения существенной структуры данных перейти к пространству показателей меньшей размерности. Такая процедура сжатия возможна*всегда
*в случае некоррелированности показателей
*никогда
*в случае сильной коррелированности показателей
48. Целью поиска ассоциативных правил является …*нахождения частых зависимостей между объектами или событиями
*определения класса объекта по его характеристикам
*определение по известным характеристиками объекта значение некоторого его параметра
*поиска независимых групп и их характеристик в всем множестве анализируемых данных
49. Чем оценивается достоверность прогноза?*оценка вероятности осуществления прогноза в заданном интервале
*шириной доверительного интервала для заданной вероятности
*суммой квадратов разностей между наблюдаемыми и расчетными величинами
*величиной вычисленной дисперсии
50. Ассоциация — …*это установление зависимости непрерывной выходной переменной отвходных переменных
*эта группировка объектов (Наблюдений, событий) на основеданных, описывающих свойства объектов
*выявление закономерностей между связанными событиями
*это установление зависимости дискретной выходной переменной от входных переменных
51. Что позволяет корреляционный анализ?*планировать эксперимент
*делать выводы о степени статистической связи между переменными.
*построить множественную регрессию
*построить прогноз
52. Что представляет собой участок ретроспекции в прогнозировании?*участок времени на который строится прогноз
*участок времени, завершающийся точечный прогнозом
*участок времени, завершающийся интервальным прогнозом
*участок, на котором формируется прогноз
53. Классификация — …*некоторый набор операций над базой данных, который рассматривается как единственное завершено, с точки зрения пользователя, действие над некоторой информацией, обычно связано с обращением к базе данных
*разновидность систем хранения, ориентирована на поддержку процесса анализа данных целостность, обеспечивает, непротиворечивость и хронологию данных, а также высокую скорость выполнения аналитических запросов
*высокоуровневые средства отражения информационной модели и описания структуры данных
*это установление зависимости дискретной выходной переменной от входных переменных
54. Что является важной частью анализа данных?*создание данных
*сортировка данных
*редактирование данных
*удаление данных
55. Пошаговая множественная регрессия применяется для…*максимизации количества независимых переменных, входящих в исследуемую модель
*установления статистической связи между переменными
*прогнозирования
*минимизации количества независимых переменных, входящих в исследуемую модель
56. Вид хранения исходных данных в среде Статграфикс?*графический
*текстовый
*электронная таблица
*кодированный
57. Какой модуль позволяет решать задачу одномерного прогнозирования с помощью ППП Статграфикс?*планирование эксперимента
*сравнение данных
*контроль качества
* анализ временных рядов
58. Сколько модулей составляют базу ППП Статграфикс?*пять
*четыре
*два
*три
59. Какую из задач можно решить с помощью модуля Статграфикс «описания данных»?*анализ одной переменной
*сравнение двух выборок
*построить простую регрессию
*кластерный анализ
60. Модели исключений описывают …*исключительные ситуации в записях, которые резко отличаются произвольной признаку от основной множества записей
*ограничения на данные анализируемого массива
*закономерности между связанными событиями
*группы, на которые можно разделить объекты, данные о которых подвергаются анализа.