- Published on
「gpt4-pdf-chatbot-langchain」のインストール・使い方
1525文字3分で読めます–––
閲覧数
- Authors
- Name
- 章 有坂
- short bio
- オープンソースソフトウェアのトレンドを追いかけてます。
gpt4-pdf-chatbot-langchainは、大量のPDFファイルに対してチャットボットを作成するためのプロジェクトです。このプロジェクトでは新しいGPT-4 APIを使用して、PDFファイルからの情報を元にチャットボットを構築します。このプロジェクトではLangChain、Pinecone、Typescript、Openai、Next.jsなどの技術スタックが使用されています。LangChainはAI/LLMアプリケーションとチャットボットの構築を容易にするフレームワークで、Pineconeは埋め込みとテキスト化されたPDFを保存し、後で同様のドキュメントを取得するためのベクターストアですSource 0。
※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。
インストール・導入方法
このプロジェクトをセットアップするための手順は以下の通りです:
- リポジトリをクローンします:
git clone [github https url]
- Yarnをグローバルにインストールします(すでにインストールしている場合はスキップ):
npm install yarn -g
- 必要なパッケージをインストールします:
yarn install
.env.example
を.env
にコピーします:
cp .env.example .env
.env
ファイルにAPIキーを追加します。OpenAIとPineconeから取得したAPIキーを使用します:
OPENAI_API_KEY=your-openai-api-key
PINECONE_API_KEY=your-pinecone-api-key
PINECONE_ENVIRONMENT=your-pinecone-environment
PINECONE_INDEX_NAME=your-pinecone-index-name
config
フォルダ内のPINECONE_NAME_SPACE
を、Pinecone上で埋め込みを保存したい名前空間に変更します。この名前空間は後でクエリと取得に使用されます。utils/makechain.ts
内のQA_PROMPT
を自分のユースケースに合わせて変更します。new OpenAI
内のmodelName
をgpt-4
に変更します(GPT-4 APIへのアクセス権がある場合)Source 0。
使い方
docs
フォルダにPDFファイルまたはPDFファイルを含むフォルダを追加します。yarn run ingest
を実行してドキュメントを'ingest'(取り込み)し、埋め込みを作成します。- Pineconeのダッシュボードをチェックして、名前空間とベクターが正しく追加されたことを確認します。
- 埋め込みとコンテンツがPineconeに正常に追加されたことを確認したら、
npm run dev
を実行してローカル開発環境を起動し、チャットインターフェースで質問を入力しますSource 0。
※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。