AIで契約書のリーガルチェックをやってみようとしたけれど…
AIは「人間の思考を模倣するもの」なので、AIが契約書のリーガルチェックをできないはずはないんですね。私は2年ほど前に初めてAIを触ってみたのですが、AIというプログラムが「人間の質問に答える」ことに驚きました。そして、AIは絶対に法務業界で使えると思いました。
当初はAIを質問コーナーのように使っていたのですが、使いはじめて3か月ほど経った頃、AIに契約書のリーガルチェックをさせるには大きな2つの問題がある、と思うようになりました。
問題① 法律情報量の不足
1つは情報量です。法律問題、とりわけ専門的な内容について質問したり契約書のリーガルチェックをするには、AIがそれなりに法律に関する情報を持っていないとダメです。
かといって、どのAIにもそのような情報が搭載されているわけではありません。私がAIを使い始めたのはちょうどChatGPT-4が発表された頃でしたが、法律の専門情報に関しては全く不足していました。ですので、AIに法律の専門情報を搭載する必要があります。
問題② クラウドAIへの情報漏洩リスク
もう1つは情報漏洩への対策です。最近、業務をしていると、いろんな人が「チャッピーに契約書をチェックさせたので見てください」と言ってくるのですが、よくそんな恐ろしいことをするなあと思っています。クラウドAIに契約書を渡すことのリスクを知らないのだろうな、と。
たとえば、ChatGPTに契約書をチェックさせるとします。質問欄に契約書をドラッグ&ドロップし、「契約書をチェックして」とプロンプトを打ち込んでリターンキーを押せば、ChatGPTはリーガルチェックを行います。
すると、ChatGPTを運営するOpenAIのサーバに契約書のデータが残るのです。しかも、運営元がのぞき込める状況で残ります。「うちは履歴が残らないようにしているから大丈夫」とおっしゃる方もいますが、OpenAIはデータ(プロンプトも)をサーバ内に30日間残し、OpenAIが読めるようにしている、ということをご存じでしょうか。
OpenAIの公式では、このように説明しています(OpenAI公式)。
チャットは手動で削除するまでアカウントに保存されます。チャット(またはアカウント)を削除すると、チャットは即座にアカウントから削除され、以下の場合を除き、30日以内にOpenAIシステムから完全に削除されます。……チャットはすでに匿名化され、あなたとの関連付けが解除されている、またはOpenAIがセキュリティ・法的義務のためにそれをより長く保持する必要がある場合などです。チャットを削除すると、復元することはできません。
つまり、どんな方法を使っても、OpenAIのサーバにデータを入れる限り、そのサーバに30日間データが残るのです。これを「30日以内にシステムから完全に削除されます」とポジティブに捉えるのか、「最長30日間、データが削除されずに残っている」とネガティブに捉えるのか。
その他、たとえばAnthropicのClaudeでも同様の定めがあり、公式には次の記述があります。
Claudeとのチャットはお客様が管理でき、いつでも会話を削除できます。会話を削除すると、チャット履歴から即座に削除され、30日以内にバックエンドストレージシステムから削除されます。
ということで、OpenAIと同じですね。
【2026年6月追記・最新状況】
このブログを書いたあと、状況がさらに動きました。結論から言うと、「クラウドAIに契約書を渡すリスク」は、当時よりもむしろ大きくなっています。
まず、削除後「30日保持」という大枠は、OpenAI・Anthropicとも今も維持されています。ただ、見過ごせない事実が3つあります。
1つ目。消費者向けのChatGPT(無料・Plus・Pro・Goプラン)は、初期設定のままだと、入力した内容がAIの学習に使われます。ビジネス・エンタープライズ向けプランは学習対象外ですが、多くの方が使っている個人向けプランは「学習オン」が初期状態です。
2つ目。AnthropicのClaudeは、消費者向け規約が2025年9月に改定され、学習利用に「オプトイン(同意)」すると、会話が非識別化された形で最長5年間保持され、モデル学習に使われるようになりました。オプトアウトすれば従来どおり30日保持・学習なしのままですが、設定ひとつで保持期間が30日から5年へと一気に延びる、ということです(参照:Anthropic「Updates to Consumer Terms and Privacy Policy」)。
3つ目。「30日で消える」という前提自体、外部要因でひっくり返ることがある、と実例で示されました。2025年5月から9月にかけて、ある著作権訴訟の裁判所命令により、OpenAIは削除済みチャットや一時チャットを含む会話データの保持を義務づけられていました(その後、標準運用に復帰)。
つまり、運営元が「30日で消します」と言っていても、訴訟などがあれば消えずに残ることがある、ということです。
弁護士は、クライアントの契約書に書かれた当事者名や取引内容を、絶対に外部に漏らせません。その立場からすると、「最長30日、第三者が見られる状況に置かれる」だけでも了解しがたいのに、「設定次第で最長5年」「訴訟があれば消えない」となれば、消費者向けクラウドAIに契約書をそのまま渡すという選択肢は、なおさらありえないわけです。
(※AI各社の保持ポリシーは頻繁に改定されます。上記は2026年6月時点の内容です。最新は各社の公式ページ=OpenAI Help Center や Anthropic のニュースリリースでご確認ください。)
30日間の是非
私は弁護士で、絶対に情報漏洩は避けないといけません。その観点からすれば、クライアントの契約書を見て契約者の名前や契約内容を知ることができる状況に置く、しかもその期間が最長30日間というのは、到底了解できません。
ですので、私以外の第三者がクライアントの契約書の内容を見られる状況でAIを使う、という選択肢はありませんでした。
ではどうすればいいのか。まず考えたのは、ローカルAI——パソコンなどにAIモデルを保存し、ウェブを使うことなくAIを使用する方法でした。ローカルAIならインターネットにつながないので、情報漏洩がまったくありません。
ローカルAIの大問題点
ご存じの方もいらっしゃると思いますが、ローカルAIのシステムを構築するには、結構高性能のパソコンが必要になります。私もかなりの大枚をはたいてパソコンを自作しました。その結果、契約書をAIに読ませてリーガルチェックをすることが可能になりました。
しかし大問題が発生しました。先ほどの2つの問題点のうち、情報漏洩とは異なるもう一方の問題、情報量です。
情報量の壁——A4で800ページが限界だった
法律関係の情報をAIに搭載していくのですが、実は、AIが一度に理解し記憶できる情報量には上限があります。
ざっくり言えば、私の経験上、100万円程度のパソコンにAIを保存して契約書のリーガルチェックに使う場合、AIが判断をする一瞬に理解・記憶できる情報量は、A4版にして800ページ分ぐらいが上限です。法律文書に必要な情報量は、そのぐらいでは到底網羅できません。
その他、技術的にはいろんな方法があるので、いろいろ試しました。詳細はややこしいITの話になるので省略しますが、私の結論は——
「能力の高いAIモデルを使って、豊富な情報を理解・記憶させて分析させるのは、ローカルAIでは無理」ということでした。
AIで、的確かつ情報漏洩のない契約書のリーガルチェックを行う方法は?
そこで私は考えました。
<実証②に続く>