Skip to content

Commit a91eee5

Browse files
committed
translate: unify Japanese Doc Extractor node name as ドキュメント抽出器
Several Japanese pages translate the Doc Extractor workflow node under inconsistent names (ドキュメントエクストラクター, ドキュメントエクストラクタ, ドキュメント抽出機, 文書抽出機, ドキュメント抽出ノード, テキスト抽出ツール), while other pages already use ドキュメント抽出器 — the same form used for the analogous Parameter Extractor node (パラメータ抽出器). Align the inconsistent pages with ドキュメント抽出器, which is also the most widely used form in the existing Japanese docs. Pages that already use ドキュメント抽出器 are left unchanged. Updated pages: - ja/use-dify/nodes/doc-extractor.mdx - ja/use-dify/tutorials/article-reader.mdx - versions/legacy/ja/user-guide/build-app/flow-app/additional-feature.mdx - versions/legacy/ja/user-guide/build-app/flow-app/file-upload.mdx - versions/legacy/ja/user-guide/build-app/flow-app/nodes/doc-extractor.mdx - versions/legacy/ja/user-guide/build-app/flow-app/nodes/list-operator.mdx - versions/legacy/ja/user-guide/build-app/flow-app/nodes/llm.mdx Intentionally left untouched: - "Doc Extractor/text" UI variable references in quick-start.mdx - "ドキュメント抽出ライブラリ" in the ETL_TYPE description (general-purpose noun, not the workflow node) - Generic "ドキュメント抽出" listed alongside other categories such as "コンテンツ分割" and "クリーニング戦略" in create-knowledge-pipeline.mdx - Generic "エクストラクタ" used as a category noun in file-upload.mdx
1 parent 6d24394 commit a91eee5

7 files changed

Lines changed: 37 additions & 37 deletions

File tree

ja/use-dify/nodes/doc-extractor.mdx

Lines changed: 7 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -1,15 +1,15 @@
11
---
2-
title: "ドキュメントエクストラクター"
2+
title: "ドキュメント抽出器"
33
description: "AI処理のためにアップロードされたドキュメントからテキストコンテンツを抽出"
44
---
55

66
<Note> ⚠️ このドキュメントは AI によって自動翻訳されています。不正確な部分がある場合は、[英語版](/en/use-dify/nodes/doc-extractor) を参照してください。</Note>
77

88

9-
ドキュメントエクストラクターノードは、アップロードされたファイルを大規模言語モデルが処理できるテキストに変換します。言語モデルはPDFやDOCXなどのドキュメント形式を直接読み取ることができないため、このノードはファイルアップロードとAI分析の間の重要な橋渡し役を果たします。
9+
ドキュメント抽出器ノードは、アップロードされたファイルを大規模言語モデルが処理できるテキストに変換します。言語モデルはPDFやDOCXなどのドキュメント形式を直接読み取ることができないため、このノードはファイルアップロードとAI分析の間の重要な橋渡し役を果たします。
1010

11-
<Frame caption="ドキュメントエクストラクターノードの設定">
12-
![ドキュメントエクストラクターノードの設定](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f3853b40904e275da895711107e9c72f.png)
11+
<Frame caption="ドキュメント抽出器ノードの設定">
12+
![ドキュメント抽出器ノードの設定](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f3853b40904e275da895711107e9c72f.png)
1313
</Frame>
1414

1515
## サポートされているファイル形式
@@ -55,7 +55,7 @@ description: "AI処理のためにアップロードされたドキュメント
5555

5656
## 実装例
5757

58-
ドキュメントエクストラクターを使用した完全なドキュメントQ&Aワークフローの例です:
58+
ドキュメント抽出器を使用した完全なドキュメントQ&Aワークフローの例です:
5959

6060
<Frame caption="ChatPDFスタイルのワークフロー実装">
6161
![ChatPDFスタイルのワークフロー実装](https://assets-docs.dify.ai/dify-enterprise-mintlify/en/guides/workflow/node/f6ea094b30b240c999a4248d1fc21a1c.png)
@@ -65,7 +65,7 @@ description: "AI処理のためにアップロードされたドキュメント
6565

6666
**ファイルアップロード設定** - ユーザーからのドキュメントアップロードを受け入れるために、Startノードでファイル入力を有効にします。
6767

68-
**テキスト抽出** - ドキュメントエクストラクターを接続して、アップロードされたファイルを処理し、テキストコンテンツを抽出します。
68+
**テキスト抽出** - ドキュメント抽出器を接続して、アップロードされたファイルを処理し、テキストコンテンツを抽出します。
6969

7070
**AI処理** - 抽出されたテキストを大規模言語モデルのプロンプトで分析、要約、または質問応答に使用します。
7171

@@ -89,7 +89,7 @@ description: "AI処理のためにアップロードされたドキュメント
8989

9090
## 処理の考慮事項
9191

92-
ドキュメントエクストラクターは、異なるファイル形式に最適化された特殊な解析ライブラリを使用します。可能な限りテキスト構造と書式を保持し、抽出されたコンテンツを大規模言語モデル処理により有用にします。
92+
ドキュメント抽出器は、異なるファイル形式に最適化された特殊な解析ライブラリを使用します。可能な限りテキスト構造と書式を保持し、抽出されたコンテンツを大規模言語モデル処理により有用にします。
9393

9494
### ファイル形式処理
9595

ja/use-dify/tutorials/article-reader.mdx

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -34,13 +34,13 @@ DifyでChatflowを作成し、モデルプロバイダーを追加して、十
3434

3535
ビジネスシーンに応じて、適切なファイルアップロード方法を選択してください。
3636

37-
### **テキスト抽出ツール**
37+
### **ドキュメント抽出器**
3838

3939
LLMはファイルを直接読み取ることができません。これは、多くのユーザーがファイルアップロード機能を初めて使用する際に抱く誤解であり、ファイルを変数としてLLMノードに適用すればよいと考えがちですが、実際にはLLMが読み取る内容は何もありません。
4040

41-
そのため、Difyではテキスト抽出ツールを導入しており、このノードはファイル変数からテキストを抽出し、テキスト形式の変数を出力します。
41+
そのため、Difyではドキュメント抽出器を導入しており、このノードはファイル変数からテキストを抽出し、テキスト形式の変数を出力します。
4242

43-
開始ノードのファイル変数を入力として、テキスト抽出ツールはドキュメント形式のファイルをテキスト形式の変数に変換します
43+
開始ノードのファイル変数を入力として、ドキュメント抽出器はドキュメント形式のファイルをテキスト形式の変数に変換します
4444

4545
<Frame>
4646
![](https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/workshop/intermediate/bc4b1492bd10ef782457ec6a709997f9.png)

versions/legacy/ja/user-guide/build-app/flow-app/additional-feature.mdx

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -79,7 +79,7 @@ LLMは直接ドキュメントファイルを読み取る機能を持ってい
7979

8080
1. Features 機能を有効にし、ファイルタイプで "ドキュメント" のみを選択します。
8181
2. [ドキュメント抽出](/ja-jp/guides/workflow/nodes/doc-extractor) ノードの入力変数で `sys.files` 変数を選択します。
82-
3. LLM ノードを追加し、システムプロンプトでドキュメント抽出ノードの出力変数を選択します
82+
3. LLM ノードを追加し、システムプロンプトでドキュメント抽出器ノードの出力変数を選択します
8383
4. 最後に "回答" ノードを追加し、LLM ノードの出力変数を記入します。
8484

8585
この方法で構築された チャットフロー アプリは、アップロードされたファイルの内容を記憶しません。アプリの使用者は毎回チャットボックスでドキュメントファイルをアップロードする必要があります。アプリにアップロードされたファイルの内容を記憶させる場合は、[「ファイルアップロード:開始ノードに変数を追加」](/ja-jp/guides/workflow/file-upload)を参照してください。
@@ -100,10 +100,10 @@ LLMは直接ドキュメントファイルを読み取る機能を持ってい
100100

101101
1. Features 機能を有効にし、ファイルタイプで "画像" および "ドキュメントファイル" を選択します。
102102
2. 二つのリスト操作ノードを追加し、"フィルタリング" 条件で画像とドキュメント変数を抽出します。
103-
3. ドキュメントファイル変数を抽出し、"ドキュメント抽出機" ノードに渡し、画像ファイル変数を抽出し、LLM ノードに渡します。
103+
3. ドキュメントファイル変数を抽出し、"ドキュメント抽出器" ノードに渡し、画像ファイル変数を抽出し、LLM ノードに渡します。
104104
4. 最後に "回答" ノードを追加し、LLM ノードの出力変数を記入します。
105105

106-
アプリ使用者が文書ファイルと画像を同時にアップロードした場合、文書ファイルは自動的に文書抽出機ノードに送られ、画像ファイルはLLMノードに送られて、ファイルを共同で処理することができます。
106+
アプリ使用者が文書ファイルと画像を同時にアップロードした場合、文書ファイルは自動的にドキュメント抽出器ノードに送られ、画像ファイルはLLMノードに送られて、ファイルを共同で処理することができます。
107107

108108
* **音声・動画ファイル**
109109

versions/legacy/ja/user-guide/build-app/flow-app/file-upload.mdx

Lines changed: 9 additions & 9 deletions
Original file line numberDiff line numberDiff line change
@@ -25,7 +25,7 @@ version: '日本語'
2525
* ファイルのアップロード:柔軟性が高く、ユーザーは特定のニーズに応じて様々なタイプのファイルをアップロードできます。
2626
* ナレッジベース:内容は比較的固定されていますが、複数のセッションで再利用が可能です。
2727
3. **情報処理**
28-
* ファイルのアップロード:ファイルの内容をLLMが理解できるテキストに変換するためには、ドキュメントエクストラクターなどのツールが必要です。このツールは、ファイルから必要な情報を抽出し、モデルが処理できる形式に整えます。
28+
* ファイルのアップロード:ファイルの内容をLLMが理解できるテキストに変換するためには、ドキュメント抽出器などのツールが必要です。このツールは、ファイルから必要な情報を抽出し、モデルが処理できる形式に整えます。
2929
* ナレッジベース:通常、前処理とインデックス作業が完了しているため、直接検索して情報を取得できます。
3030
4. **アプリケーションシーン**
3131
* ファイルのアップロード:ユーザー固有の文書を処理する必要があるシーンで非常に有効です。例えば、文書分析やパーソナライズされた学習支援などが挙げられます。
@@ -96,13 +96,13 @@ Difyは、[チャットフロー](/ja-jp/guides/workflow/concepts) と [ワー
9696
<img src="https://assets-docs.dify.ai/2024/11/a7154e8966d979dcba13eac0a172ef89.png" alt="Chatflow应用中文件上传功能的设置界面" />
9797
</Frame>
9898

99-
機能を有効にしても、LLM(大規模言語モデル)がファイルを直接読み取ることはできません。ファイルをLLMが理解できるテキスト形式に変換するには、ドキュメント抽出ツールが必要です
99+
機能を有効にしても、LLM(大規模言語モデル)がファイルを直接読み取ることはできません。ファイルをLLMが理解できるテキスト形式に変換するには、ドキュメント抽出器が必要です
100100

101101
* 音声ファイルについては、`gpt-4o-audio-preview`などのマルチモーダル入力に対応したモデルを使用することで、音声を直接処理できます。この場合、追加のエクストラクタは必要ありません。
102102
* 映像やその他のファイルタイプについては、対応するエクストラクタがまだ用意されておらず、外部ツールを統合するためには開発者が外部ツールにアクセスする必要があります。[外部ツール](/ja-jp/guides/workflow/nodes/iteration)を接続して処理する必要があります。
103103

104-
2. [テキスト抽出ツール](/ja-jp/guides/workflow/nodes/doc-extractor)ノードを追加し、入力変数で `sys.files` 変数を選択します。
105-
3. LLMノードを追加し、システムプロンプトでテキスト抽出ツールノードの出力変数を選択します
104+
2. [ドキュメント抽出器](/ja-jp/guides/workflow/nodes/doc-extractor)ノードを追加し、入力変数で `sys.files` 変数を選択します。
105+
3. LLMノードを追加し、システムプロンプトでドキュメント抽出器ノードの出力変数を選択します
106106
4. 最後に「直接応答」ノードを追加し、LLMノードの出力変数を入力します。
107107

108108
<Frame caption="ファイルアップロードののワークフロー">
@@ -138,25 +138,25 @@ LLMが対話中にファイル内容を記憶する機能を追加したい場
138138
ファイル変数の使用方法には主に2つのアプローチがあります:
139139

140140
1. ツールノードを利用してファイルの内容を変換する:
141-
* ドキュメント形式のファイルの場合、「ドキュメントエクストラクタ」ノードを使ってファイルの内容をテキスト形式に変換できます。
141+
* ドキュメント形式のファイルの場合、「ドキュメント抽出器」ノードを使ってファイルの内容をテキスト形式に変換できます。
142142
* この方法は、ファイルの内容をモデルが理解できる形式(例: string、array[string]など)に変換する必要がある場合に適しています。
143143
2. LLMノード内でファイル変数を直接使用する:
144144
* 特定の種類のファイル(例: 画像)の場合、LLMノード内でファイル変数を直接使用することができます。
145145
* たとえば、画像形式のファイル変数を使用する場合、LLMノードで視覚機能を有効にし、変数セレクターで該当するファイル変数を直接参照できます。
146146

147147
どちらの方法を選ぶかは、ファイルの種類と具体的な要件によります。以下で、これら2つの方法の具体的な手順について詳しく説明します。
148148

149-
#### 2. テキスト抽出ツールノードの追加
149+
#### 2. ドキュメント抽出器ノードの追加
150150

151-
ファイルをアップロードすると、そのファイルは「単一ファイル」変数に保存されます。しかし、LLMは変数内のファイルを直接読み込むことができないため、まず[**テキスト抽出ツール**](/ja-jp/guides/workflow/nodes/doc-extractor)ノードを追加する必要があります。
151+
ファイルをアップロードすると、そのファイルは「単一ファイル」変数に保存されます。しかし、LLMは変数内のファイルを直接読み込むことができないため、まず[**ドキュメント抽出器**](/ja-jp/guides/workflow/nodes/doc-extractor)ノードを追加する必要があります。
152152

153-
「開始」ノード内のファイル変数を **テキスト抽出ツール** ノードの入力変数として使用します。
153+
「開始」ノード内のファイル変数を **ドキュメント抽出器** ノードの入力変数として使用します。
154154

155155
<Frame caption="入力変数を追加する">
156156
<img src="https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/guides/workflow/b18af11da3f339c496193d9732906849.png" alt="入力変数を追加する" />
157157
</Frame>
158158

159-
テキスト抽出ツール」ノードの出力変数をLLMノードのシステムプロンプトに貼り付けます。
159+
ドキュメント抽出器」ノードの出力変数をLLMノードのシステムプロンプトに貼り付けます。
160160

161161
<Frame caption="システムプロンプトの単語を貼り付けます">
162162
<img src="https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/guides/workflow/8e6a3deaaa5eebeb66f9e1d844dc1ec6.png" alt="システムプロンプトの単語を貼り付けます" />

versions/legacy/ja/user-guide/build-app/flow-app/nodes/doc-extractor.mdx

Lines changed: 11 additions & 11 deletions
Original file line numberDiff line numberDiff line change
@@ -1,11 +1,11 @@
11
---
2-
title: テキスト抽出ツール
2+
title: ドキュメント抽出器
33
version: '日本語'
44
---
55

66
### 定義
77

8-
LLM(大規模言語モデル)は文書の内容を直接読み取ることができません。そのため、ユーザーがアップロードした文書を”テキスト抽出ツールノード”を介して解析し、文書ファイルの情報を読み取り、テキストに変換して内容をLLMに送信する必要があります。
8+
LLM(大規模言語モデル)は文書の内容を直接読み取ることができません。そのため、ユーザーがアップロードした文書を”ドキュメント抽出器ノード”を介して解析し、文書ファイルの情報を読み取り、テキストに変換して内容をLLMに送信する必要があります。
99

1010
### 適用シナリオ
1111

@@ -14,20 +14,20 @@ LLM(大規模言語モデル)は文書の内容を直接読み取ること
1414

1515
### ノードの機能
1616

17-
テキスト抽出ツールノードは、情報を処理する中心的な役割を果たします。入力変数内のファイルを識別して読み取り、情報を抽出し、string型の出力変数に変換して、後続のノードが呼び出すために提供します。
17+
ドキュメント抽出器ノードは、情報を処理する中心的な役割を果たします。入力変数内のファイルを識別して読み取り、情報を抽出し、string型の出力変数に変換して、後続のノードが呼び出すために提供します。
1818

1919
![](/ja-jp/img/0cbfd9c1d9d56e6a528b134bd07662ec.png)
2020

21-
テキスト抽出ツールノードは、入力変数と出力変数に分かれています。
21+
ドキュメント抽出器ノードは、入力変数と出力変数に分かれています。
2222

2323
#### 入力変数
2424

25-
テキスト抽出ツールは以下のデータ構造の変数のみを受け入れます
25+
ドキュメント抽出器は以下のデータ構造の変数のみを受け入れます
2626

2727
* `File`,1つのファイル
2828
* `Array[File]`,複数のファイル
2929

30-
テキスト抽出ツールは、テキスト、Markdown、PDF、HTML、DOCX形式のファイルなどの文書タイプから情報を抽出できますが、画像、音声、映像などの形式のファイルは処理できません。
30+
ドキュメント抽出器は、テキスト、Markdown、PDF、HTML、DOCX形式のファイルなどの文書タイプから情報を抽出できますが、画像、音声、映像などの形式のファイルは処理できません。
3131

3232
#### 出力変数
3333

@@ -40,17 +40,17 @@ LLM(大規模言語モデル)は文書の内容を直接読み取ること
4040
4141
### 設定例
4242

43-
典型的なファイルインタラクションの質疑応答シナリオでは、テキスト抽出ツールはLLMノードの前段階として機能し、アプリのファイル情報を抽出し、LLMノードに渡してユーザーのファイルに関する質問に回答します。
43+
典型的なファイルインタラクションの質疑応答シナリオでは、ドキュメント抽出器はLLMノードの前段階として機能し、アプリのファイル情報を抽出し、LLMノードに渡してユーザーのファイルに関する質問に回答します。
4444

45-
このセクションでは、典型的なChatPDFサンプルワークフローテンプレートを用いて、テキスト抽出ツールノードの使用方法を説明します
45+
このセクションでは、典型的なChatPDFサンプルワークフローテンプレートを用いて、ドキュメント抽出器ノードの使用方法を説明します
4646

4747
![](/ja-jp/img/46a1f939088176a76e843422360ea948.png)
4848

4949
**設定手順:**
5050

5151
1. アプリでファイルアップロード機能を有効にします。 [“スタート”](./start) ノードで**単一ファイル変数**を追加し、`pdf`と名付けます。
52-
2. テキスト抽出ツールノードを追加し、入力変数で`pdf`変数を選択します。
53-
3. LLMノードを追加し、システムプロンプトでテキスト抽出ツールノードの出力変数を選択します。LLMはこの出力変数を使用してファイルの内容を読み取ることができます。
52+
2. ドキュメント抽出器ノードを追加し、入力変数で`pdf`変数を選択します。
53+
3. LLMノードを追加し、システムプロンプトでドキュメント抽出器ノードの出力変数を選択します。LLMはこの出力変数を使用してファイルの内容を読み取ることができます。
5454

5555
![](/ja-jp/img/4f307d5ece35155a24eac7013766f9ee.png)
5656

@@ -59,7 +59,7 @@ LLM(大規模言語モデル)は文書の内容を直接読み取ること
5959
設定が完了すると、アプリケーションはファイルアップロード機能を持ち、ユーザーはPDFファイルをアップロードして対話を展開できるようになります。
6060

6161
<Frame>
62-
<img src="https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/guides/workflow/node/27173b2503ca7241b084f7cbd17cdb4c.png" alt="ドキュメント抽出ノードの設定" />
62+
<img src="https://assets-docs.dify.ai/dify-enterprise-mintlify/jp/guides/workflow/node/27173b2503ca7241b084f7cbd17cdb4c.png" alt="ドキュメント抽出器ノードの設定" />
6363
</Frame>
6464

6565
<Tip>

0 commit comments

Comments
 (0)