生成型 AI：セキュリティ分析担当者の真のアシスタント |サイバーフォートレス

01. AIとセキュリティ分析担当者の間(GAP)を減らそう

セキュリティ業界に導入されたAIが担当する業務は次のようになる。一日数千件多い場合は数億件が発生するセキュリティイベントを効率的に対応する業務である。セキュリティ監視現場の担当者が1つ1つ確認が必要なセキュリティイベントがAIの適用で95％以下に減らされる。さらに危険度が高いセキュリティイベントは自動的に遮断されたり既存のシグネチャーでは検知が難しい攻撃タイプについては検知ルール作成を推奨したりする。
セキュリティ分析担当者はAIがなぜこのような結果を予測したか判断根拠を確認しながら人工知能の評価を行ったり検知ルールの作成を行ったりする。

このような形がセキュリティ監視分野にAIが適用された様子である。しかしながら、現場ではそうでもない。まだAIが予測した結果がセキュリティ分析担当者の業務に意思決定の手伝いに「限界がある。」と意見が多い。上級セキュリティ分析担当者の場合は、セキュリティに対する知識は多いけどAIに対する知識が足りずデータ及びアルゴリズム基盤の予測結果に対する判断根拠を理解するのことが難しいため、既存のSIEMから収集されたデータを基に分析をする。初級セキュリティ分析担当者の場合、AI知識だけではなくセキュリティ知識も足りないため、セキュリティ監視現場でAIの適用はもっと困難している。
このように現在までセキュリティ業界でAIのメリットと限界が明確になっているところで2022年末にChatGPTが公開された。全世界で話題になり、セキュリティ業界の場合はAIとセキュリティ分析担当者の間(GAP)を減らせるきっかけになるのではないかと期待している。このようなChatGPTのような生成型 AIはLLM(大規模言語モデル)を基盤としてセキュリティ分析担当者がAIの分析結果を理解しやすく説明し、AIとの違和感を減らすことができる。初級分析担当者には上記のメリットも含めてセキュリティ知識までAIと対話するようにQ&Aができるため、迅速にセキュリティ監視現場の業務把握ができる。

02. 生成型 AIでセキュリティサービスを提供するときの注意事項

生成型 AIでセキュリティサービスを提供するときは大きく2つのタイプで分かれる。
一つ目はサブスクリプションサービスのタイプである。このようなサービスは【図①】のように外部のLLMをAPIまたはページの形で入力して結果を出力してもらえる。ここで注意することは2つでプロンプトエンジニアリング、データセキュリティがある。
まず、プロンプトエンジニアリングの場合、膨大で多様な分野の情報を知っているLLMからセキュリティ分析担当者が知りたかるセキュリティ分野に特化されたお問い合わせを整える過程である。

【▲ 図①　サブスクリプションサービスのアーキテクチャ】

そしてデータセキュリティの場合はオンライン形で提供されるサービスの特性上、OpenAIのGPT APIやGoogleのPALM APIでLLMを使用しながらセキュリティ監視現場で顧客に関する機密情報(Payload, IP, Domain)が外部に漏洩される可能性があるため、セキュリティが重要である。そのため最近ではAIを適用する場合非識別のための多様な研究が行われている。
二つ目は構築型である。このようなサービスタイプは【図②】のように最近話題になるデータセキュリティ問題を解決しながらLLMを適用する方法である。生成型 AIを構築型システムタイプで実際のセキュリティ監視現場でローカルLLMを構築すると、セキュリティに関する問題は解決できるが次の3つに注意が必要である。まず、①ファインチューニングをするためのベースモデルの偏向性有無の把握、②ファインチューニングのためのセキュリティ監視現場の学習データの確保、③ファインチューニングモデルの性能評価指標である。

【▲ 図②　構築型システムアーキテクチャ】

まず、ファインチューニングとは既に学習されているモデルを特定ドメインに特化された少数のデータで学習及びパラメータチューニングする意味である。ベースモデルのAI偏向性有無の把握が必要な理由はLLMの場合、多様な分野のデータが学習されているため、宗教、政治、性別などにAIが偏向されないとAIの公正性が保障できるし、学習データ基盤のファインチューニングを行ったときに、セキュリティ監視現場に最適化されたLLMが構築できる。
そして、ファインチューニングモデルの性能評価指標が重要な理由はセキュリティ監視現場でモデルを利用して予測されるセキュリティイベントに対するAIの正確度を判断する重要な基準のためである。LLM性能評価指標の場合、既存AI検知モデルと違って、正検知・誤検知の性能評価や多重分類性能評価とは違うため、持続的な研究及びセキュリティ監視現場の顧客との協議が必要である。

03. サービスタイプ別(サブスクリプション vs 構築型)のメリットと限界

まず、サブスクリプションサービスのメリットと限界である。
メリットは便利な利用や持続的なアップデート低費用運用などがある。サブスクリプションサービスを使用するとセキュリティ業界にAIを適用するための別途インフラを構築する必要がないため、迅速にAIの導入ができる。また、サービスはクラウドで管理されるため、新たなデータと技術発展によるAIモデルが持続的にアップデートされて最新のセキュリティ知識が活用できる。そしてクラウド基盤のサブスクリプションモデルを使用すると初期費用を減らすことができ、使用量によって柔軟に費用を調節できるメリットがある。
しかし、依存性、データセキュリティ、カスタマイズ(最適化)に対する制限がある。サブスクリプションサービスを使用すると外部に頼るため、サービス中止やネットワーク問題など外部の問題で利用が制限される可能性がある。また、サブスクリプションサービスはクラウドからデータを処理するため機密情報のセキュリティ及び個人情報保護に対する懸念がある。外部供給者が提供するサービスは普遍的な要求事故を満たすために設計されているため、特定の企業や組織の個別的な要求には完璧に合わない場合がある。

二つ目は構築型システムのメリットと限界である。
メリットとしてはデータのセキュリティ、個別化されたモデル開発などがある。構築型システムを使用すると機密情報がローカルで処理されるため、データセキュリティと個人情報保護を強化することができる。ローカルにAIモデルを構築するとネットワークの遅延時間などの問題なくリアルタイムで分析と予測ができる。特に大規模のデータセットを使用する場合、性能向上が期待される。構築型システムは企業や組織の特々な要求事項に合わせてAIモデルを開発し、ファインチューニングできる柔軟性が提供される。
しかし、初期費用及び複雑性、アップデートとメンテナンス、拡張性と柔軟性の制限などがある。構築型システムを構築するためには初期費用が必要で、インフラ構築とメンテナンスに対する複雑性も考慮対象になる。また、新たなデータと技術発展に対するアップデートを直接管理する必要がある。これは追加的な費用と時間が所要される。また、構築型システムのはローカル環境から運用されるため、規模の拡張や柔軟な運用に制限がかかる可能性がある。これは今後要求事項に対する制約を持ってくる。

04. まとめ

AIを否定的に見る人の場合、AIが人を代替し、職場が消えるのではないかと心配をしている。しかし、AIをうまく使用する企業または人は、逆にAIを使用しない企業または人を代替すると思う。それでAIが初めて登場した背景であるアシスタントとして、人の意思決定に役に立つところを考えると生成型 AIは最適の方法だと思われる。

Written by CYBERFORTRESS, INC.