/a/オープンソース
Published on

「gpt4-pdf-chatbot-langchain」のインストール・使い方

1525文字3分で読めます–––
閲覧数
Authors
  • avatar
    Name
    章 有坂
    short bio
    オープンソースソフトウェアのトレンドを追いかけてます。

gpt4-pdf-chatbot-langchainは、大量のPDFファイルに対してチャットボットを作成するためのプロジェクトです。このプロジェクトでは新しいGPT-4 APIを使用して、PDFファイルからの情報を元にチャットボットを構築します。このプロジェクトではLangChain、Pinecone、Typescript、Openai、Next.jsなどの技術スタックが使用されています。LangChainはAI/LLMアプリケーションとチャットボットの構築を容易にするフレームワークで、Pineconeは埋め込みとテキスト化されたPDFを保存し、後で同様のドキュメントを取得するためのベクターストアですSource 0

※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。

インストール・導入方法

このプロジェクトをセットアップするための手順は以下の通りです:

  1. リポジトリをクローンします:
git clone [github https url]
  1. Yarnをグローバルにインストールします(すでにインストールしている場合はスキップ):
npm install yarn -g
  1. 必要なパッケージをインストールします:
yarn install
  1. .env.example.envにコピーします:
cp .env.example .env
  1. .envファイルにAPIキーを追加します。OpenAIとPineconeから取得したAPIキーを使用します:
OPENAI_API_KEY=your-openai-api-key
PINECONE_API_KEY=your-pinecone-api-key
PINECONE_ENVIRONMENT=your-pinecone-environment
PINECONE_INDEX_NAME=your-pinecone-index-name
  1. configフォルダ内のPINECONE_NAME_SPACEを、Pinecone上で埋め込みを保存したい名前空間に変更します。この名前空間は後でクエリと取得に使用されます。
  2. utils/makechain.ts内のQA_PROMPTを自分のユースケースに合わせて変更します。new OpenAI内のmodelNamegpt-4に変更します(GPT-4 APIへのアクセス権がある場合)Source 0

使い方

  1. docsフォルダにPDFファイルまたはPDFファイルを含むフォルダを追加します。
  2. yarn run ingestを実行してドキュメントを'ingest'(取り込み)し、埋め込みを作成します。
  3. Pineconeのダッシュボードをチェックして、名前空間とベクターが正しく追加されたことを確認します。
  4. 埋め込みとコンテンツがPineconeに正常に追加されたことを確認したら、npm run devを実行してローカル開発環境を起動し、チャットインターフェースで質問を入力しますSource 0
※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。
avatar

章 有坂

オープンソースソフトウェアのプロ / ベテランのソフトウェア技術者 / Github専門家
オープンソースソフトウェアが好きな編集部が、GithubやGitlabなどの新着リポジトリやトレンドのプロジェクトを分かりやすく紹介。