AAA
Обычный Черный

Кто не делится найденным, подобен свету в дупле секвойи (древняя индейская пословица)

версия для печатиВерсия для печати



Библиографическая запись: Вопросы. — Текст : электронный // Myfilology.ru – информационный филологический ресурс : [сайт]. – URL: https://myfilology.ru//165/analiz-dannyx/voprosy/ (дата обращения: 25.04.2024)

Вопросы

Вопросы

Содержание

    Тема 1. Введение в анализ данных.
    Виды данных – количественные, порядковые и номинальные.
    Задачи анализа данных: классификация, группировка, прогнозирование,
    нахождение ассоциаций и зависимостей, визуализация. Основные разделы,
    на которых базируется анализ данных: статистика, базы данных и знаний,
    распознавание образов, искусственный интеллект. Классификация методов
    анализа данных. Этапы анализа данных: выявление закономерностей,
    прогнозирование, анализ исключений. Сферы применения анализа данных:
    финансы и банковское дело, маркетинг, медицина, генетика,
    биоинформатика, интернет.
    Наиболее важные законы распределения, их свойства. Законы
    распределения: равномерное, нормальное (гауссово), Стьюдента, «хиквадрат», экспоненциальное, Фишера. Числовые характеристики
    случайных величин, характеристики центра группирования и вариации.
    Теоретические моменты.

    Тема 2. Основы выборочного метода.
    Основные определения и понятия выборочного метода. Повторные
    и бесповторные выборки. Первичный анализ данных, группировка.
    Дискретные и интервальные вариационные ряды. Формула Стерджеса.
    Генеральные характеристики: среднее, дисперсия, моменты высших
    порядков (асимметрия, эксцесс). Мода и Медиана. Эмпирическая функция
    распределения, полигон и гистограмма.

    Тема 3. Оценка параметров распределения.
    Точечные оценки. Несмещенность, состоятельность и
    эффективность точечных оценок. Оценивание параметров функции
    распределения. Метод моментов. Метод максимального правдоподобия.
    Интервальные оценки. Точность и надежность выборочных оценок.
    Доверительная вероятность. Доверительный интервал. Определение
    объѐма репрезентативной выборки для однородной и стратифицированной
    генеральной совокупности.

    Тема 4. Проверка статистических гипотез.
    Ошибки первого и второго рода. Уровень значимости и мощность
    критерия. Описание гипотез и критерии их проверки. Простые и сложные
    гипотезы. Проверка гипотез о равенстве средних и дисперсий двух
    нормально распределенных генеральных совокупностей. Хи-квадрат
    критерий Пирсона: проверка гипотезы о соответствии наблюдаемых
    значений предполагаемому распределению вероятностей (дискретному
    или непрерывному). Проверка гипотез о вероятностной природе данных
    (стационарности, нормальности, независимости, однородности).

    Тема 5. Статистический анализ связей.
    Функциональная и статистическая зависимости. Корреляционная
    таблица. Групповые средние. Понятие корреляционной зависимости.
    Эмпирическая ковариация. Выборочный коэффициент корреляции, его
    свойства. Основные задачи теории корреляции: определение формы и
    оценка тесноты связи. Виды корреляционной связи (парная и
    множественная, линейная и нелинейная).
    Линейная корреляция. Уравнения прямых регрессии для парной
    корреляции. Определение параметров прямых регрессии методом
    наименьших квадратов. Значимость коэффициентов по критерию
    Стьюдента.

    Тема 6. Дисперсионный анализ.
    Однофакторный дисперсионный анализ с одинаковым числом
    испытаний на различных уровнях. Однофакторный дисперсионный анализ
    с различным числом испытаний на различных уровнях. Двух- и
    многофакторный дисперсионный анализ. Критерий адекватности
    Фишера.

    Раздел 1. Введение, основные понятия анализа данных
    Введение в машинное обучение и анализ данных. Анализ данных в различных
    прикладных областях. Основные определения. Этапы анализа данных. Постановки задач
    машинного обучения. Примеры прикладных задач и их типы: классификация, регрессия,
    ранжирование, кластеризация, поиск структуры в данных.

    Раздел 2. Математические объекты и методы в анализе данных
    Линейная алгебра и анализ данных. Линейные пространства, их примеры из машинного
    обучения (признаки в кредитом скоринге, векторные представления текстов).
    Коллинеарность и линейная независимость. Скалярное произведение, косинус угла,
    примеры их применения. Векторы и матрицы, операции над ними. Матричное умножение.
    Системы линейных уравнений. Обратная матрица.
    Математический анализ и анализ данных (на примере парной линейной регрессии и
    МНК). Производная и градиент, их свойства и интерпретации. Типы функций:
    непрерывные, разрывные, гладкие. Градиентный спуск. Выпуклые функции и их особое
    место в оптимизации.
    Теория вероятностей и анализ данных. Случайные величины. Дискретные и непрерывные
    распределения, их свойства. Примеры распределений и их важность в анализе данных:
    биномиальное, пуассоновское, нормальное, экспоненциальное. Характеристики
    распределений: среднее, медиана, дисперсия, квантили. Пример их использования при
    генерации признаков. Центральная предельная теорема.
    Математическая статистика и анализ данных. Оценивание параметров распределений.
    Метод максимального правдоподобия. Пример использования: анализ текстов и наивный
    байесовский классификатор. Доверительные интервалы и бутстрэппинг.

    Раздел 3. Линейная регрессия и классификация
    Линейная регрессия. Квадратичная функция потерь и предположение о нормальном
    распределении шума. Метод наименьших квадратов: аналитическое решение и
    оптимизационный подход. Стохастический градиентный спуск. Тонкости градиентного
    спуска: размер шага, начальное приближение, нормировка признаков. Проблема
    переобучения. Регуляризация.
    Линейная классификация. Аппроксимация дискретной функции потерь. Отступ. Примеры
    аппроксимаций, их особенности. Градиентный спуск, регуляризация. Классификация и
    оценки принадлежности классам. Кредитный скоринг. Логистическая регрессия: откуда
    берется такая функция потерь и почему она позволяет предсказывать вероятности.
    Максимизация зазора как пример регуляризации и устранения неоднозначности решения.

    Раздел 4. Оценивание качества алгоритмов
    Регрессия: квадратичные и абсолютные потери, абсолютные логарифмические
    отклонения. Примеры использования.
    Классификация: доля верных ответов, ее недостатки. Точность и полнота, их
    объединение: арифметическое среднее, минимум, гармоническое среднее (F-мера).
    Оценки принадлежности классам: площади под кривыми. AUC-ROC, AUC-PRC, их
    свойства. Оценивание качества алгоритмов. Отложенная выборка, ее недостатки. Оценка полного
    скользящего контроля. Кросс-валидация. Leave-one-out.
    Практические особенности кросс-валидации. Стратификация. Потенциальные проблемы с
    разбиением зависимой или динамической выборки.

    Раздел 5. Логические методы
    Логические методы и их интерпретируемость. Простейший пример: список решений.
    Пример решающего списка для задачи фильтрации нежелательных сообщений. Деревья
    решений. Проблема построения оптимального дерева решений. Жадный алгоритм,
    основные его параметры.
    Построение деревьев решений. Критерий ветвления. Выбор оптимального разбиения в
    задачах регрессии. Сложности выбора разбиения в задаче классификации. Примеры
    критериев: энтропийный (прирост информации), Джини и их модификации. Критерии
    завершения построения. Регуляризация и стрижка деревьев.

    Раздел 6. Композиции алгоритмов
    Простейший пример: уменьшение дисперсии при усреднении алгоритмов методом
    бутстреп. Блендинг алгоритмов.Понятие смещения и разброса (иллюстрация на примере
    линейных методов и решающих деревьев). Уменьшение разброса с помощью усреднения.
    Случайный лес. Оценка out-of-bag.

    Раздел 7. Особенности реальных данных
    Неполнота и противоречивость. Шумы и выбросы в данных. Методы поиска выбросов.
    Пропуски в данных, методы их восстановления. Несбалансированные выборки: проблемы
    и методы борьбы. Задача отбора признаков, примеры подходов.

    Раздел 8. Анализ частых множеств признаков и ассоциативных правил
    Задача анализа потребительской корзины. Поддержка и достоверность. Частые, замкнутые
    и максимальные частые множества. Алгоритм Априори. Меры “интересности правил”.

    Раздел 9.Кластеризация данных
    Простые эвристические подходы. Алгоритм K-Means. Проблема устойчивости
    результатов и важность грамотной инициализации, алгоритм K-Means++. Выбор числа
    кластеров. Оценка качества кластеризации. 

    Кто во что горазд...

    Тема 1. Основы анализа данных. Системы поддержки принятия решений
    Введение. Понятие анализа данных. Задачи систем поддержки принятия решений.
    OLTP и OLAP-системы. Принципы построения информационных хранилищ. Модели
    информационных хранилищ. Многомерная модель данных. Правила Кодда. Размерностные
    модели. MOLAP, ROLAP, HOLAP- системы. Витрины данных. ETL
    (ExtractingTransformatingandLoading) – средство извлечения, обработки и загрузки данных.
    Добыча данных. Добыча данных в управлении качеством. DataMining. Стандарты
    DataMining. Стандарт CWM, CRISP, PMML. Жизненный цикл процесса анализа данных.
    Классификация методов DataMining. Модели DataMining. Понятие данные и знания. Процесс
    обнаружения знаний. Классификация задач DataMining. Методы анализа данных.
    Разведочный анализ данных. Очистка и фильтрация данных. Статистические диаграммы.
    «Ящичные» диаграммы. Диаграммы «ствол-листья». Задачи классификации и регрессии.
    Использование статистических пакетов для интеллектуального анализа данных. Понятие
    бизнес-аналитики. Средства бизнес-аналитики. Средства легкой бизнес-аналитики. QlikView,
    QlikSence.

    Тема 2. Предобработка и очистка данных
    Методология KDD. Задачи предобработки данных. Технология ETL. Просмотр данных.
    Очистка данных. Оценка качества данных. Заполнение пропущенных данных. Аномальные и
    предельные данные. Использование ящечной диаграммы. Выявление дубликатов и
    противоречий. Корреляционный анализ. Использование факторного анализа при
    предобработке данных. Трансформация данных. Квантование. Сэмплинг. Группировка
    данных.

    Тема 3. Классификационный анализ без обучения. Кластерный анализ
    Постановка задач кластерного анализа. Определение кластера. Параметры кластера.
    Меры близости. Метрики кластерного анализа. Базовые алгоритмы кластеризации. Иерархическая кластеризация. Дендограммы. Метод К-средних. Профили кластеров.
    Взаимосвязь кластерного и регрессионного анализа. Использование пакета Deductor для
    решения задач кластерного анализа. Кластерный анализ в средствах интеллектулаьного
    анализа MicrosoftOffice.

    Тема 4. Анализ взаимосвязей между переменными. Ассоциативные правила
    Основные положения непараметрической и нечисловой статистики. Таблицы
    сопряженности. Таблица сопряженности 2х2. Таблицы флагов и заголовков.
    Непараметрические и нечисловые критерии. Канонический анализ. Корреляционная
    матрица. Коэффициенты канонической корреляции. Меры избыточности переменных.
    Задачи ассоциации. Ассоциативные правила. Поддержка и достоверность ассоциативных
    правил. Лифт. Алгоритмы построения ассоциативных правил. Рекомендации по генерации
    правил. Алгоритм apriori. Использование пакета Deductor для построения ассоциативных
    правил.

    Тема 5. Классификационный анализ с обучением
    Формулировка задачи классификации. Классификационный анализ с обучением.
    Деревья решений. Алгоритмы построения деревьев решений. Классификация критериев
    разбиений. Критерий Gini. Деревья классификации и их свойства. Типы ветвления. Методы и
    алгоритмы построения деревьев. Алгоритм CART. Определение прекращения построения
    дерева классификации. Использование нейронных сетей для решения задач классификации.
    Карты Кохоннена. Логистическая регресссия. Сравнение результатов классификации
    различными методами.
    Примеры алгоритмов построения деревьев решений. Использование статистических
    пакетов Deductor, Statistica, Excel для построения деревьев решений.

    Вопросы разные

    1. Виды данных – количественные, порядковые и номинальные.
    2. Задачи анализа данных: классификация, группировка,
    прогнозирование,нахождение ассоциаций и зависимостей,
    визуализация.
    3. Основные разделы,на которых базируется Анализ и обработка данных :
    статистика, базы данных и знаний,распознавание образов,
    искусственный интеллект.
    4. Классификация методов анализа данных. Этапы анализа данных:
    выявление закономерностей, прогнозирование, анализ исключений.
    5. Сферы применения анализа данных:
    финансы и банковское дело, маркетинг, медицина, генетика,
    биоинформатика, интернет.
    6. Наиболее важные законы распределения, их свойства.
    7. Законы распределения: равномерное, нормальное (гауссово),
    Стьюдента, «хи-квадрат», экспоненциальное, Фишера.
    Числовые характеристики
    случайных величин, характеристики центра группирования и вариации.
    8. Теоретические моменты.
    9. Основные определения и понятия выборочного метода. Повторные
    и бесповторные выборки. Первичный Анализ и обработка данных ,
    группировка.
    10.Дискретные и интервальные вариационные ряды. Формула Стерджеса.
    11.Генеральные характеристики: среднее, дисперсия, моменты высших
    порядков (асимметрия, эксцесс). Мода и Медиана.
    12.Эмпирическая функция
    распределения, полигон и гистограмма.
    13.Точечные оценки. Несмещенность, состоятельность и
    эффективность точечных оценок.
    14.Оценивание параметров функции
    распределения.
    15.Метод моментов. Метод максимального правдоподобия.
    16.Интервальные оценки. Точность и надежность выборочных оценок.
    17.Доверительная вероятность. Доверительный интервал.
    18. Определение объѐма репрезентативной выборки для однородной и
    стратифицированной генеральной совокупности.
    19.Ошибки первого и второго рода. Уровень значимости и мощность
    критерия.
    20.Описание гипотез и критерии их проверки. Простые и сложные
    гипотезы.
    21.Проверка гипотез о равенстве средних и дисперсий двух
    нормально распределенных генеральных совокупностей.
    22.Хи-квадрати критерий Пирсона: проверка гипотезы о соответствии
    наблюдаемых значений предполагаемому распределению вероятностей
    (дискретному или непрерывному).
    23.Проверка гипотез о вероятностной природе данных
    (стационарности, нормальности, независимости, однородности).
    24.Функциональная и статистическая зависимости. Корреляционная
    таблица. Групповые средние. Понятие корреляционной зависимости.
    25.Эмпирическая ковариация. Выборочный коэффициент корреляции, его
    свойства. Основные задачи теории корреляции: определение формы и
    оценка тесноты связи.
    26.Виды корреляционной связи (парная и
    множественная, линейная и нелинейная).
    27.Линейная корреляция. Уравнения прямых регрессии для парной
    корреляции.
    28. Определение параметров прямых регрессии методом
    наименьших квадратов.
    29.Значимость коэффициентов по критерию
    Стьюдента.
    30.Однофакторный дисперсионный анализ с одинаковым числом
    испытаний на различных уровнях.
    31.Однофакторный дисперсионный анализ
    с различным числом испытаний на различных уровнях.
    32.Двух- и многофакторный дисперсионный анализ. Критерий
    адекватности Фишера.

    Примерный перечень вопросов
    1. Основные понятия машинного обучения. Основные постановки задач. Примеры
    прикладных задач.
    2. Линейные пространства. Векторы и матрицы. Линейная независимость. Обратная
    матрица.
    3. Производная и градиент функции. Градиентный спуск. Выпуклые функции.
    4. Случайные величины. Дискретные и непрерывные распределения. Примеры.
    5. Оценивание параметров распределений, метод максимального правдоподобия.
    Бутстрэппинг.
    6. Линейные методы классификации и регрессии: функционалы качества, методы
    настройки, особенности применения.
    7. Метрики качества алгоритм регрессии и классификации.
    8. Оценивание качества алгоритмов. Отложенная выборка, ее недостатки. Оценка
    полного скользящего контроля. Кросс-валидация. Leave-one-out.
    9. Деревья решений. Методы построения деревьев. Их регуляризация.
    10. Композиции алгоритмов. Разложение ошибки на смещение и разброс.
    11. Случайный лес, его особенности.
    12. Методы поиска выбросов в данных. Методы восстановления пропусков в данных.
    Работа с несбалансированными выборками.
    13. Задача анализа потребительской корзины. Поддержка и достоверность. Частые,
    замкнутые и максимальные частые множества. Алгоритм Априори.
    14. Задача кластеризации. Алгоритм K-Means. Оценки качества кластеризации.

    1 Дисперсионный анализ данных.
    2 Кластерный анализ данных.
    3 Методы классификации в Data mining.
    4 Регрессионный анализ данных.
    5 Анализ данных с использованием бинарной логистической регрессии.
    6 Факторный анализ данных.
    7 Метрики, применяемые в Data mining.
    8 Ковариационный анализ данных.
    9 Методы поиска ассоциативных правил.
    10 Cиквенциальный анализ даных (поиск последовательных шаблонов).
    11 Основные стандарты Data mining.
    12 Анализ данных с использованием сети Кохонена.

     2
    1 Характеристики инструментальных средств Data mining.
    2 Реляционные хранилища данных.
    3 Многомерные хранилища данных.
    4 Гибридные хранилища данных.
    5 Виртуальные хранилища данных.
    6 Характеристика ETL-процесса.
    7 Оценка качества, очистка и предобработка анализируемых данных.
    8 Сокращение размерности исходного множества анализируемых данных.

     3
    1 Искусственные нейронные сети. Многослойный персептрон.
    2 Анализ данных с использованием генетических алгоритмов.
    3 Анализ данных с использованием самоорганизующихся карт.
    4 Оценка значимости регрессионных моделей с применением t-критерия Стьюдента
    5 Оценка значимости регрессионных моделей с применением F-критерия Фишера.
    6 Алгоритм построения деревьев решений ID3
    7 Алгоритм построения деревьев решений С4.5.
    8 Оценка полезности, эффективности и точности моделей, применяемых для анализа
    данных.

    1. Практическое применение алгоритмов Data mining.
    2. Классификация с несколькими независимыми переменными методом Naïve Bayes.
    3. Поиск оптимальной функции методом наименьших квадратов.
    4. Сиквенциальный анализ.
    5. Меры близости, основанные на расстояниях, используемые в алгоритмах
    кластеризации.
    6. Кластеризация данных при помощи нечетких отношений.
    7. Характеристика классов задач, решаемых методами Data Mining.
    8. Стандарты Data mining. Характеристика стандартов CWM и PMLL.
    9. Библиотеки доступа к алгоритмам Data mining. Характеристика библиотеки
    Xelopes.
    10. Характеристика программных инструментов для выполнения интеллектуального
    анализа данных.
    11. Общая характеристика и классификация методов кластерного анализа данных.
    12. Анализ данных с использованием методов классификации и регрессии.
    13. Цели, задачи и принципы построения деревьев решений. Общая характеристика
    алгоритмов построения деревьев решений.
    14. Сферы применения деревьев решений.
    15. Цели, задачи и принципы работы нейронных сетей.
    16. Алгоритмы обучения нейронных сетей.
    17. Цели, задачи, принципы и модели прогнозирования.

    вопросы


    1. Модели и их свойства. Аналитический и информационный походы к
    моделированию.
    2. Формы представления, типы и виды анализируемых данных.
    3. Обучение моделей «с учителем» и «без учителя». Обучающее и тестовое
    множество. Ошибки обучения. Эффект переобучения.
    4. Общая схема анализа данных. Требования к алгоритмам анализа данных.
    5. Характеристика этапов технологии KDD.
    6. Data Mining. Характеристика классов задач, решаемых методами Data Mining.
    7. Программный инструментарий для выполнения анализа данных.
    8. Основные положения концепции хранилищ данных (DW).


    1. 1. Цели и задачи аффинитивного анализа. Поддержка и достоверность ассоциативных правил. Лифт и левередж.
      2. Сферы применения ассоциативных правил.
      3. Иерархические ассоциативные правила.
      4. Цели, задачи и основное содержание кластерного анализа. Классификация методов кластеризации.
      5. Способы определения меры расстояния между кластерами.
      6. Характеристика методов связи для процедуры кластеризации (одиночная, полная, средняя).
      7. Алгоритм кластеризации k-means.
      8. Сети Кохонена (KCN).
      9. Карты Кохонена (SOM).
      10. Проблемы алгоритмов кластеризации.
      11. Цели, задачи и отличительные особенности классификации и регрессии.
      12. Сферы применения методов классификации и регрессии.
      13. Простая линейная регрессия.
      14. Оценка соответствия простой линейной регрессии реальным данным.
      15. Простая регрессионная модель.
      16. Оценка значимости простой регрессионной модели (t-критерий и F-критерий).
      17. Множественная линейная регрессия.
      18. Модель множественной линейной регрессии.
      19. Оценка значимости множественной регрессионной модели.
      20. Регрессия с категориальными входными переменными.
      21. Методы отбора переменных в регрессионные модели.
      22. Ограничения применимости регрессионных моделей.
      23. Логистическая регрессия. Интерпретация модели логистической регрессии.
      24. Множественная логистическая регрессия.
      25. Цели, задачи и принципы построения деревьев решений. Общая характеристика алгоритмов построения деревьев решений.
      26. Сферы применения деревьев решений.
      27. Алгоритмы IDЗ и С4.5.
      28. Алгоритм CART.
      29. Упрощение деревьев решений.
      30. Цели, задачи и принципы работы нейронных сетей.
      31. Принципы функционирования многослойного персептрона.
      32. Алгоритмы обучения нейронных сетей.
      33. Алгоритм обратного распространения ошибки.
      34. Общая характеристика временных рядов и их компонентов. Цели и задачи анализа
      временных рядов.
      35. Цели, задачи и принципы прогнозирования. Модели прогнозирования. Обобщенная
      модель прогноза.
      36. Ансамбли моделей. Бэггинг. Бустинг.
      37. Альтернативные методы построения ансамблей.
      38. Оценка эффективности и сравнение моделей.
      39. Lift- и Profit-кривые.
      40. ROC-анализ.

    Еще вопросы

    1. Системы поддержки принятия решений. Хранилища данных.
      2. Размерностные модели. OLAP-куб. Таблица размерностей. Таблица фактов.
      3. Сравнительный анализ OLAP и OLTP-систем.
      4. Понятие бизнес-аналитики. Классификация средств «бизнес-аналитики».
      5. Этапы анализа данных. КDD.
      6. Data Mining. Сдерстваобработки Data Mining
      7. Элементы математической статистики. Описательная статистика. Операции
      агрегирования данных.
      8. Графические средства анализа. Диаграмма рассеяния. Гистограмма.
      9. Начальные этапы KDD. ETL. Средства очистки и трансформации данных.
      10. Классфикация метод предобработки и очистки данных.
      11. Методы борьбы с аномалиями. Ящечная диаграмма.
      12. Общая характеристика задач кластерного анализа.
      13. Метрики кластерного анализа.
      14. Методы определения близости между кластерами.
      15. Иерархическая кластеризация. Дендограмма.
      16. Метод к-средних.
      17. Ассоциативные правила. Свойства антимонотонности.
      18. Метрики построения ассоциативных правил.
      19. Алгоритм построения ассоциативных правил a’priori.
      20. Общая характеристика деревьев решений.
      21. Алгоритмы построения деревьев решений.
      22. Оценка качества классификации. Задачи классификации. ROC-кривая. Таблица
      сопряженности.
      23. Определение регрессионной модели. Логистическая регрессионная модель.
      Использование логистической модели для классификации.
      24. Нейронные сети. Перцептрон. Радиальные базисные сети.
      25. Использование карты Кохоннена для решения задач классификации.
      26. Общая характеристика QlikView.
      27. Общая характеристика DeductorAcademic.
      28. Общая характеристика средств интеллектуального анализа SQLServer.

    Читать

    1. Прикладные методы анализа статистических данных [Электронный ресурс]: учеб.
      пособие / Горяинова Е.Р., Панков А.Р., Платонов Е.Н. - М. : ИД Высшей школы экономики,
      2012. -- 310, [2] с. - 1000 экз. - ISBN 978-5-7598-0866-4.
    2. Популярное введение в современный анализ данных в системе STATISTICA
      [Электронный ресурс] : Учебное пособие для вузов / Боровиков В.П. - М. : Горячая линия -
      Телеком, 2013. - 288 с., ил. - ISBN 978-5-9912-0326-5.
    3. 1. Барсегян А.А, Куприянов М.С., Степаненко В.В., Холод И.И. Анализ данных и
      процессов. 3-е изд. [Электронный ресурс]- СПб. : БХВ-Петербург, 2010, 512 с.-
      2. Методы и модели прогнозирования социально- экономических процессов :
      [учеб. пособие] / Т. С. Клебанова [и др.] ; Федер. гос. бюджетное образовательное
      учреждение высш. проф. образования, Рос. акад. нар. хоз-ва и гос. службы при Президенте
      Рос. Федерации, Сев.-Зап. ин-т упр. - СПб. : Изд-во СЗИУ РАНХиГС, 2012. - 564 c.
      3. Миркин, Борис Григорьевич. Введение в анализ данных [Электронный
      ресурс] : учебник и практикум / Б. Г. Миркин ; Нац. исслед. ун-т Высш. шк. экономики. -
      Электрон. дан. - М. : Юрайт, 2016. - 174 c.
      4. Наследов, Андрей Дмитриевич. Математические методы психологического
      исследования : анализ и интерпретация данных : [учебное пособие] / А.Д. Наследова. - СПб. :
      Речь, 2007. - 390 c.
      5. Паклин, Николай Борисович. Бизнес-аналитика: от данных к знаниям :
      [хранилища данных и OLAP, очистка и предобработка данных, основные алгоритмы
      DataMining, сравнение и ансамбли моделей, решение бизнес задач на аналитической
      платформе Deductor] : учеб. пособие / Н. Паклин, В. Орешков. - 2-е изд., испр. - СПб.[и др.] :
      Питер, 2013. - 701 c.

    Дополнительная литература


    1. Барсегян А.А, Куприянов М.С., Степаненко В.В., Холод И.И. Технология
    анализа данных: DataMining, VisualMining, TextMining, OLAP. – СПб.: БХВ-Петербург,
    2004.- книги нет в фонде научной библиотеки СЗИУ, можно использовать только в доп. лит.
    2. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде
    Windows. – М.: Финансы и статистика, 2000.
    3. Винстон, Уэйн Л. Excel 2007 : Анализ данных и бизнес- моделирование = Excel
    2007: DataAnalysisiandBusinessModeling : [пер. с англ.] / Уэйн Л. Винстон. - М. : Рус. Редакция ;
    СПб. : БХВ-Петербург, 2008. - 594 c.
    4. Кацко И.А., Паклин Н.Б. Практикум по анализу данных на компьютере. – М.:
    КолосС, 2009. -278 с. книги нет в фонде научной библиотеки СЗИУ, можно использовать
    только в доп. лит.
    5. Ларсон Б. Разработка Бизнес-аналитики в Microsoft SQL Server 2005. – Москва:
    «Питер», 2008.
    6. Наследов А. SPSS 19. Профессиональный статистический анализ данных. –
    СПб. : Питер, 2011.
    7. Наумов В.Н. Средства бизнес-аналитики. – СПб.: СЗИУ, 2016. . книги нет в
    фонде научной библиотеки СЗИУ, можно использовать только в доп. лит.
    8. Тихомиров Н.П. Методы эконометрики и многомерного статистического
    анализа. – М.: Экономика, 2011.
    9. Халафян А.А. STATISTICA 6. Статистический анализ данных. – М.: ООО
    «Бином-Пресс», 2007.

    14.06.2021, 984 просмотра.


    Уважаемые посетители! С болью в сердце сообщаем вам, что этот сайт собирает метаданные пользователя (cookie, данные об IP-адресе и местоположении), что жизненно необходимо для функционирования сайта и поддержания его жизнедеятельности.

    Если вы ни под каким предлогом не хотите предоставлять эти данные для обработки, - пожалуйста, срочно покиньте сайт и мы никому не скажем что вы тут были. С неизменной заботой, администрация сайта.

    Dear visitors! It is a pain in our heart to inform you that this site collects user metadata (cookies, IP address and location data), which is vital for the operation of the site and the maintenance of its life.

    If you do not want to provide this data for processing under any pretext, please leave the site immediately and we will not tell anyone that you were here. With the same care, the site administration.