最終更新日:2025年2月1日
データ活用の精度が企業の競争力に直結する現在。
データ基盤には、AIも含めた様々な用途に対応する柔軟性やセキュリティ性、
激しい技術変化に対応する拡張性などが、高いレベルで求められています。
この記事では、これらのハードルをいかにクリアし、データ基盤を構築すべきかを探ります。
企業が保有するデータは、大きく分けて下記の2種類に区別されます。
行列のような定められた構造に当てはめて保存されたデータです。
Excel、CSVといったファイルや、関係データベースに管理されているデータなどがこれにあたり、行や列ごとに意味や関係性が明確に定義されているため、検索や集計、分析などさまざまな用途に容易に活用することができます。
構造が定義されておらず、自由な形式で保存されたデータです。
メールやチャット、wordやパワーポイント、PDFといったドキュメントの他、画像/音声/映像も非構造化データにあたります。
業務プロセスで発生するデータの多くは非構造化データであり、顧客の感情やニーズなど、定量的に区別や評価ができない複雑な情報が大量に含まれているため、データの分析・活用を正確に実行することができれば、ビジネスに大きなインパクトを与えることが可能です。
生成AIが従来のデータ活用ツールと大きく異なるのは、この非構造化データを高精度で分析できるという点です。
これまで社内でただ眠っていた大量の非構造化データは、生成AIの登場により、新たなビジネス価値を与えうる宝の山となりました。この新たな価値をいかに取り出し磨いていくかが求められていますが、データ基盤に必要な要件には下記のようなポイントがあります。
非構造化データは量が膨大になりがちで、価値を生むものもあれば、そうでないものもあります。AIで処理するには、これらのファイルを整理し、関連性を持った多様なデータ同士を連携させていく必要があります。
これらの一連のデータ基盤内での処理もAIを活用し自動化しますが、そのためには事前にデータ活用の目的に合わせ、情報の整合性/優先度/関連情報の紐づけ等を踏まえた整備ルールを設けることが重要です。
またデータは常に各部門から大量に生み出されていきます。これらを自動でリアルタイムに取り込み、処理していくことがデータ基盤には求められます。
また、AIをはじめとした各種業務アプリ側も、データ基盤が処理したリアルタイムのデータを活用してプッシュ型で分析結果や提案をタイムリーに行うような環境も整備が進んでいくことでしょう。
一方で、データ基盤構築を進めるにあたり下記のような点に注意が必要です。
非構造化データはその自由さから、非常に莫大な量になり、発生する場所もさまざまです。これらをサイロ化することなく、一元管理するためには、ファイルサーバとデータ基盤とを組み合わせて考える必要があります。
特に今後はセンシング技術等の発展もあり、取り扱えるデータ量がさらに増加していくことが予想され、ファイルサーバ/データ基盤ともスケールアップが必要になる可能性が高いと思われます。今後の拡張性を考慮し、クラウドベースのソリューションを活用することも一つの方法です。
データ基盤にはさまざまなデータが集約されるため、対内でも対外でも対策を取ることが必要です。
対内として保護規則やコンプライアンス要件を遵守することが求められ、法律や規制に準拠した上で、継続的なコンプライアンスの評価と監視を行う必要があります。
対外としては不正アクセスやデータ漏洩を防ぐために、アクセス管理の厳格化、データの暗号化、定期的なセキュリティ監査の実施などにより強固なセキュリティ対策を実施していくことが必要です。
一方でLLM構築において、セキュリティを考慮して社外ネットワークと切り離された環境とすると、外部データソースがAI分析に利用できないというデメリットも生じます。
データ活用とセキュリティのバランスを取りながら、ビジネス推進上の目的をいかに達成するかを検討する必要があります。
データ基盤構築後の運用保守も重要なポイントの一つです。特にAI活用においては、技術更新の動きが大きくかつ早く、その変化にタイムリーに対応していく組織体制やデジタル人材の確保が必要です。
HITでは、上記のような課題に対応し、AX(AIトランスフォーメーション)実現を支援する各種サービスをワンストップで提供しています。
データ基盤構築はもちろん、セキュリティと柔軟性の両面に優れたAIサービスと運用保守により、お客様が常に最適なデータに基づいて、高度なAI活用とビジネス推進が行える環境を構築いたします。
※画面はイメージです。
※掲載されている第三者の企業名、商品名、サービス名称等は、各社の商標または登録商標です。