さくらのAI Engineを触ってみた(1) RAG検索編

未分類

さくらインターネット といえばインターネット老人会の皆様には馴染み深いのではないでしょうか。
インターネット黎明期から日本国内のレンタルサーバーといえば最初に出てくるのがさくらインターネットさんですよね。

そんなさくらインターネットさんもいまはガバメントクラウドを始めてたり、NVIDIA H100 GPUを搭載したAI向けの高火力サーバも提供されてます。

そんな中、さくらのAI サービスから さくらのAI Engine が登場しました。

さくらのAI Engine

基盤モデル搭載済みGPUサーバーで推論処理ができるAPIサービス となっており文字通りAPIを通していくつかのLLMを利用することができます。

さくらのAI Engine | さくらのAI | さくらインターネット
基盤モデル搭載済みGPUサーバーで推論処理ができるAPIサービス。サーバー構築・運用不要。セキュアな国内完結の環境で複数の基盤モデルを無料でご利用いただけます。

プランが2種類あり、 基盤モデル無償プラン従量課金プラン の2つです。
基盤モデル無償プランは決められたリクエスト数まで利用できもし超過したらレート制御がかかるプランです。
従量課金プランは無償プランと同じ無料枠があり、それを超過したら自動的に従量課金となるプランです。
なお、基盤モデル無償プランは申込数に上限があるとのことなので、早めの登録がいいと思います。

また、データセンターが国内で完結しているので、国外リソースを使わないのも安心できますね。

利用できる基盤モデル

  • gpt-oss-120b
  • Qwen3-Coder-480B-A35B-Instruct-FP8
  • Qwen3-Coder-30B-A3B-Instruct
  • llm-jp-3.1-8x13b-instruct4
  • whisper-large-v3-turbo
  • multilingual-e5-large

上4つはチャット、whisperは音声書き起こし、multilingualはEmbeddingモデルです。

従量課金など料金はサービスページを参照してください。

触ってみよう

今回はさくらのナレッジにあるハンズオンをもとにして触ってみます。

さくらのAI Engine ことはじめ(1):基本(チャット)機能とRAG、MCPによる自然言語検索 | さくらのナレッジ
目次さくらのAI Engine とは企業にとっての生成AIと解決すべき課題さっそくやってみるまとめ さくらのAI Engine とは 本日『さくらのAI Engine』という新しいサービスがリリースされました。さくらイン

基本的には手順はそのままで問題ないので、ここでは実行環境とかについて触れておこうと思います。

私は以下の環境でやりました。

  • Ubuntu 24.04 LTS Desktop
  • node, npmはnvmをつかって以下のようにインストール
$ curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash
$ \. "$HOME/.nvm/nvm.sh"
$ nvm install 22
$ node -v
v22.20.0
$ npm install node-fetch form-data dotenv

ドキュメント検索してみた

$ node search.mjs "個人情報とは"
Vector query: 個人情報とは tags: []
→ 3 snippet(s) found

 RAG Answer:

**個人情報(個人情報等)とは**  

法律上は「個人情報等」と呼ばれ、**「特定の個人を識別できる情報」**、あるいは **「他の情報と容易に照合することで特定の個人を識別できる情報」** を指します。具体的には、次のような情報が含まれます。

| 区分 | 具体例 |
|------|--------|
| **直接的に本人を特定できる情報** | 氏名、住所、電話番号、メールアドレス、生年月日、顔画像など |
| **間接的に本人を特定できる情報** | 行動履歴、政治的立場、経済状況、趣味・嗜好、健康状態、位置情報、取引履歴など |
| **高度なデジタル技術で生成・解析される情報** | AI・顔認識・プロファイリング等により推定された属性や評価、パーソナライズド広告のためのデータ |

---

### コンテキストから読み取れるポイント

1. **利用価値の拡大**  
   - デジタル技術の進展により、個人情報は「個人の利益」だけでなく「公益」のためにも活用できるようになり、幅広く取り扱われるようになっている(#1)。

2. **プライバシーと倫理の重要性**  
   - 個人情報やプライバシーへの認識が高まり、データ倫理・人間中心のAI、プライバシーガバナンス、プライバシー強化技術(PET)の開発・実装が進んでいる(#1)。

3. **リスクと不安**  
   - 顔認証やAIによる高精度なプロファイリング、民間事業者による大量データ取扱いが増える一方で、不適正利用が個人の権利・利益を大きく侵害するリスクが高まっている(#1)。

4. **国外への提供と透明性**  
   - クラウドやSNS等の外部委託先へ個人情報を提供する場合、適切な監督・安全管理・外国の個人情報保護制度に関する情報提供が求められ、透明性と信頼性の確保が重要になる(#2)。

5. **個人のデータリテラシー向上**  
   - 法律の正しい理解と、本人が意思に基づき情報をコントロールできる意識を育むことが重要。開示請求や事前同意取得時の情報提供などが制度で保障されている(#3)。

---

### まとめ

個人情報とは、**本人を直接または間接的に特定できるあらゆる情報**であり、デジタル技術の発展に伴いその利用範囲は拡大しています。一方で、**不適正な利用が個人の権利侵害につながるリスク**が高まっているため、プライバシーガバナンスや透明性の確保、そして個人自身のデータリテラシー向上が重要な課題となっています。

コメント

タイトルとURLをコピーしました