mag:ais
This is an old revision of the document!
Table of Contents
Аналитические информационные системы
Лекции
Лекции четыре штуки:
- Вводно-обзорная (не нарезана). Можно посмотреть 2-ю и затем эту.
- Извлечение, трансформация, сохранение в промежуточную базу данных.
- Хранилища данных, представление данных, гиперкуб, OLAP -->.
- Аналитическая обработка данных в хранилище
- Многомерный статистический анализ (МСА) данных: Регрессия, Классификация, Таксономия
- МСА данных: анализ информативной емкости, временные ряды
- Использование FRiS-функция для решения задач МСА
Весь плей-лист.
Соединение с сервером
Для выполнения работ необходимо войти в виртуальную сеть (VPN) при помощи программы Zerotier, адрес сети находится в канале, здесь я его публиковать не буду.
- Качаете программу, устанавливаете (в современных дистрибутивах Linux пакет называется zerotier-one),
- Выполняете подключение своего компьютера командой
join <hex-идентификатор сети>
или через интерфейс в трее Windows.
Сервисы сервера 192.168.191.46 (kuber)
я сначала пишу документацию, потом настрою сервисы
Сервер находится в ИрНИТУ, (Научно-исследовательский иркутский государственный технический университет). Объем дискового пространства - 1.1 T, оперативной памяти - 58 Гигабайт + 58 Гигабайт swap.
- СУБД Postgres-14 (стандартный порт 5432) с доступом к нему из командной строки (пользователь
leti
с паролем) в терминалеssh
или черезssh
-туннель (не тестировал).pgsql -U leti <имя БД или leti>
,pgcli <имя БД или leti> leti
- командная строка с автодополнением.
- К PostgreSQL в сети VPN есть доступ при помощи pgAdmin4 http://192.168.191.46:8888/, пользователь leti@etu.ru, пароль сообщу в канал.
- СУБД Microsoft SQL Server (стандартный порт ….), доступ из командной строки
sqlcmd -C -U leti
, такжеmssql-cli -C -U leti
(еще не установил).mssql-cli -C -S localhost -U <имя пользователя> -d <имя базы данных> -P '<пароль>'
- командная строкас автодополнением.- Доступ в DBeaver через
ssh
- туннель с данными учетной записи.
- Сервер поддерживает
Docker
. - Веб-приложение Metabase http://192.168.191.46:3000/ .
- Веб-приложение Jupyter Lab http://kuber.isclan.ru:8880/lab (пароль обычный). в консоли можно добавлять новые модули
pip install <модуль>
. Установлены следующие модули:- Математические библиотеки
numpy
,pandas
,scipy
,matplotlib
; - Object-relational mapper
sqlalchemy
https://docs.sqlalchemy.org/en/20/orm/quickstart.html - модуль для PostgreSQL (
psycopg2
), https://docs.sqlalchemy.org/en/20/dialects/postgresql.html ; - … MySQL/MariaDB (
mysqlclient
, но локального сервера нет, заказывайте), https://docs.sqlalchemy.org/en/20/dialects/mysql.html ; - … MS SQL Server (
pymssql
,PyODBC
, не тестировал), https://docs.sqlalchemy.org/en/20/dialects/mssql.html . - … SQLite3 (встроен в Python,
sqlite3
), https://docs.sqlalchemy.org/en/20/dialects/sqlite.html .
Удаленный доступ к серверу по ssh
ssh 192.168.191.46 -l leti
Варианты задач
Комбинируем вариант базы данных:
northwind
,dvdrental
.airflies
Метод многомерного анализа данных (МСА):
- Регрессионный анализ,
- Классификация,
- Таксономия (aka Кластерный анализ),
- Анализ информативной емкости атрибутов и/или объектов (aka Метод главных компонент),
- (Не пробовал на базах данных) Планирование эксперимента,
- Задачи 1-5, примененные к временным рядам и биоинформатическим данным.
В Теории вероятностей есть задачи на
- Построение гистограмм и тестирования гипотез.
Полезные ссылки
Создайте себе папку и там работайте, если требуется отдельный пользователь, пишите в Telegram @eugeneai.
mag/ais.1688089337.txt.gz · Last modified: 2023/06/30 09:42 by eugeneai