はじめに
こんにちは、エンジニアの髙橋です。
普段は、Azure Databricks やData Factory などを用いて、ETL 基盤の構築を行なっています。
3/5(火)に、Microsoft が主催するセミナー「SQL Server Day」に参加してきたので、その概要と感想についてお伝えします。
今回参加したセミナーは、現在プレビュー版である、SQL Server 2019 の最新情報について、1日で知ることができるという内容になっております。
SQL Server 2019 の特徴として、Big Data やAI に注目した機能が追加されています。
セミナーは4部構成で、各セッションの内容は以下となっていました。
- SQL Server 2019 最新情報
- Azure SQL Database Managed Instance 概要
- データベースマイグレーション 最新情報
- 既存データ資産を生かしたデータベースの最新化
それぞれの内容について、まとめていこうと思います。
1. SQL Server 2019 最新情報
SQL Server 2019 の最大の特徴として、Big Data 分析に最適化されているという点が挙げられます。
SQL Server 2019 では、kubernetes を用いて展開されたBig Data Cluster が用意されているようです。
これらのクラスターでは、データは仮想化され、データの移動をすることなく外部データソースを参照し、分析をすることが可能です。
また、スケーラブルなHDFS をストレージとして利用するため、構築されたデータにSpark やSQL を使用して容易にアクセスできます。
さらに、PolyBase と呼ばれるデータソースコネクタが強化され、ODBC 経由でのデータアクセスの他、Mongo DB やCosmos DB などのNoSQL へのデータアクセスも可能となっています。
ローカルからのデータベース操作は、従来はSQL Management Studio を使って、GUI操作を行うことが多かったと思われますが、Azure Data Studio という名前のGUI ツールがリリースされています。
Azure Data Studio では、拡張機能を利用することで、SQL Server 2019 向けの機能もサポートされているようです。
これは、Windows だけでなく、Mac やLinux でも動作するので、Mac ユーザーの自分にとっては嬉しい情報でした。
その他、新しくUTF-8 に対応した照合順序がサポートされ、CHAR / VARCHAR 型のデータ型に対してUnicode 文字を入れられるようになったことなども印象的でした。
2. Azure SQL Database Managed Instance 概要
Azure SQL Database Managed Instance 概要
2018年10月にGA されたManaged Instance は、オンプレミスのSQL Server の柔軟な移行のためのサービスです。
従来のSQL Database への移行では、シングルデータベースが使われており、複数のデータベースを移行する場合、データベース間の関係性の考慮が必要だったり、それぞれのデータベースを統合してから移行するような手段が必要でした。
Managed Instance を用いることで、複数のデータベースの移行において、データベース間の関係性の再構築を考慮せずに移行ができるようです。
また、冗長構成やバックアップなどについても、意識することなく移行することが可能となっているようです。
オンプレミスのSQL Server が複数運用されているようなサービスでは有用ですね。
3. データベースマイグレーション 最新情報
他RDBMS からSQL Server へのデータ移行では、SQL Server Migration Assistant (SSMA) というツールを使うことで、効率良く移行することができるようです。
SQL Server Migration Assistant
Oracle やMySQL などからの特定のデータソースに対しては、SSMA を用いて直接移行が可能である他、サポートされていないデータソースに対しては、一度MySQL などへの移行をした後にSSMA を利用するといった手法もあることを話されていました。
また、SQL Server 2012 からSQL Server 2017 への移行など、アップグレードに関しては、Data Migration Assistant (DMA) というツールがサポートしているようです。
移行についての詳しい情報は以下のガイドから確認できます。
オンプレミスのSQL Server をSQL Database に移行する際の、必要性能については、下記を用いて計算できます。
Azure SQL Database DTU Calculator
4. 既存データ資産を生かしたデータベースの最新化
このセッションでは、Oracle を用いた場合とSQL Server を用いた場合の比較や、移行事例についての紹介がメインでした。
Azure SQL Data Warehouse についての紹介もあり、どのようなケースでどういったDatalake を選択するのがよいかのイメージがつきました。
また、オンプレミスのクラウド移行の際に、IaaS (Azure VM) よりもPaaS (Azure SQL Database) に移行するほうが良いという話もありました。
最後には、自分が業務で使っている、Azure Databricks やAzure Data Factory についての紹介もあり、最新のサービスを使っていることを再認識しました。
おわりに
今回SQL Server 2019 の最新情報について理解するために参加してみて、新しいサービスを活用するためには、既存の基本的なサービスについての理解が重要だと感じました。
しかし、そんな中でもハイブリッドなデータ分析やオンプレミスのデータ移行について学べたので、参加してよかったと思います。
エムティーアイはクラウドの活用が進んでいるので、オンプレミスのデータは多くないとは思いますが、データ移行したいけど出来ないといったケースをなるべく減らしていきたいですね。
また、自分はデータベースはNoSQL から入った世代で、新しいサービスを立ち上げる際はNoSQL データベースを採用するケースが多かったのですが、RDB も選択肢に入れて比較できるように、今後も勉強していきたいと思います。