У Microsoft тоже есть облако Azure, и в нем есть целая платформа для аналитики, которая называется Azure Synapse Analytics. В него входять уже устоявшиеся инструменты Azure SQL Data Warehouse (теперь называется Dedicated SQL Pool), Azure Data Factory, Azure ML, Power BI Service, так и были добавлены новые Azure Spark Pools, Serverless SQL Pool. Все достаточно удобно, каждый инструмент легко интегрируется с решениями Azure. Если вы работаете с решениями Microsoft, то облако Azure это следующий логический шаг вашего развития. Так же Azure Synapse способен заменить решения Azure HDInsight и Azure Databricks (решения для big data). По опыту я знаю и видел огромное количество решений на Microsoft SQL Server (on-premise), но вообще не знаю ниодного решния на Azure Synapse, но уверен скоро их появится много.
В этом видео мы:
📌 Посмотрим на история Azure хранилища данных
📌 Узнаем про стратегию создания продуктов Microsoft
📌 Узнаем про переход от Azure SQL Data warehouse к Azure Synapse Analytics
📌 Познакомимся с Azure Synapse Analytics: Dedicated SQL Pools, Spark Pools, Serverless SQL Pools
📌 Azure Synapse Serverless Pools vs Amazon Redshift Spectrum
📌 Посмотрим на пример архитектурты Azure Data Platfrom и узнаем какие инстурменты есть в Azure для аналитики
📌 Детально посмотрим на особенности Azure Dedicated SQL Pools (бывшее Azure SQL DW), узнаем, что внутнри и как с ним работать и оптимизировать (distribution stiles, indexes, statistics)
📌 Узнаем, что такое PolyBase или как загружать данные из Azure Hadoop
📌 Узнаем про Azure Data Factory
📌 Поговорим про бесполезность и полезность Azure Analyses Services
📌 Поговорим про конкуренция Azure Databricks и Azure Synapse Spark pools
На лабораторных работах я вам покажу:
📌 Как создать Azure Synapse Workspace
📌 Как в нем создать Serverless SQL Pools, Dedicated SQL Pool (Azure DW)
📌 Посмотрим, что внутри Synapse Workspace
📌 Покажу вам, как можно поиграться с данными NY taxi
📌 Покажу, где взять открытые данные по COVID-19
=========================================
В 6 модуле мы узнаем про аналитические и облачные хранилища данных которые используются в индустрии. Крупные компания Amazon, Microsoft, Airbnb, и многие другие из списка SP500 используют одну или сразу несколько решений для аналитических хранилищ данных - Amazon Redshift, Microsoft Synapse, Google BigQuery или Snowflake. Но кроме облачных хранилищ есть еще много on-premise Teradata, Greenplum, Vertica, Exasol и тп.
Из модуля вы узнаете:
📌 Основы аналитических хранилищ данных
📌 MPP vs SMP
📌 Практика с Redshift, Snowflake и Azure Synapse
📌 Облачные ETL инструменты
📌 Обзор вакансий мирового рынка
📌 Обзор решений для операционной аналитики - Splunk, Azure Data Explorer и ElasticSearch
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь и проходите курс Инженера Данных.
⚠️ КУРС БЕСПЛАТНЫЙ!
🔗 Записаться вы можете на нашем портале datalearn.ru/
👍🏻 Запись на курс даст вам возможность не только просматривать видео, но и получить доступ к закрытым материалам, а также возможность выполнять домашние задания и получить сертификат прохождения курса.
🔥Самые актуальные новости про аналитику в Telegram канале: t.me/rockyourdata
Негізгі бет DATALEARN | DE - 101 | МОДУЛЬ 6-4 ЗНАКОМСТВО С AZURE SYNAPSE ANALYTICS (AZURE DATAWAREHOUSE)
Пікірлер: 6