fix(list_datasets): 改讀內建 dataset 目錄，移除壞掉的 /datalist 呼叫 by linsamtw · Pull Request #7 · FinMind/FinMind-MCP

linsamtw · 2026-06-01T05:31:37Z

問題（已隨 PyPI 0.0.2 上線）

list_datasets 工具與 ChatGPT Action 的 listDatasets 都呼叫 /api/v4/datalist 想取得「所有 dataset 名稱」，但該 endpoint 實際回傳的是國家清單：

GET /api/v4/datalist → 200 {"data":["Canda","China","Euro","Japan","Taiwan","UK"]}

FinMind 沒有「列出所有 dataset」的 API；/datalist 的真正用途是列出某 dataset 底下的 data_id。後果：

MCP 使用者呼叫 list_datasets 拿到無意義的國家名單。
Custom GPT 呼叫 listDatasets 拿到同樣結果，於是退回用知識庫「猜」dataset 來回答（實測在 GPT builder preview 重現）。

修正

dataset 總表本來就由 knowledge/datasets.md 提供（與 Custom GPT knowledge bundle 同一個 SSOT）。list_datasets 改為讀取該檔，不再打 API。

檔案	變更
`src/finmind_mcp/knowledge.py`	新增 `dataset_catalog()` 解析 datasets.md（90 筆，含分類/層級/說明），缺檔回 `[]`
`src/finmind_mcp/tools.py`	`_list_datasets` 改讀 catalog、不呼叫 client；更新工具描述
`src/finmind_mcp/client.py`	移除壞掉的 `list_datasets()`（`/v4/datalist`）
`chatgpt/openapi.yaml`	移除 `listDatasets` operation / `/v4/datalist` path / `DatasetList` schema
`knowledge/instructions.md`	移除「/datalist — 列出可用 dataset」錯誤敘述
`docs/spec.md`, `docs/mcp-original-readme.md`	同步修正工具↔endpoint 對照

測試

tests/test_knowledge.py（新增）：驗 catalog 解析 ≥80 筆、欄位完整、legend 不產生記錄、TaiwanStockPrice 為 Free。
tests/test_tools.py：list_datasets 改驗從知識庫讀取且未呼叫 client。
tests/test_client.py：移除 test_list_datasets；test_token_from_env 改用 query_dataset。

驗證：32 passed、smoke OK、build_instructions 7986/8000 chars、openapi 驗證通過。

發版

合併後需下新 tag（如 v0.0.3）觸發 CICD 重新發 PyPI，修正才會到使用者端。

🤖 Generated with Claude Code

問題：list_datasets 工具與 ChatGPT Action 都呼叫 /api/v4/datalist 想取得「所有 dataset 名稱」，但該 endpoint 實際回傳的是國家清單（["Canda","China","Euro","Japan","Taiwan","UK"]），並非 dataset。 FinMind 根本沒有「列出所有 dataset」的 API；/datalist 的真正用途是列出某 dataset 底下的 data_id。此 bug 已隨 PyPI 0.0.2 上線：MCP 使用者呼叫 list_datasets 會拿到無意義的國家名單，Custom GPT 呼叫 listDatasets 也拿到同樣結果而退回用知識庫猜測回答。修正方向：dataset 總表本來就由 knowledge/datasets.md 提供（與 Custom GPT knowledge bundle 同一個 SSOT），list_datasets 改為讀取該檔，不再打 API。變更檔案： - src/finmind_mcp/knowledge.py：新增 dataset_catalog()，解析 datasets.md 的 ## 分類 / ### dataset / Tier / 描述，回傳 90 筆有序記錄；datasets.md 缺檔時回 []（CI 無 knowledge/ 時可優雅降級）。 - src/finmind_mcp/tools.py：_list_datasets 改呼叫 knowledge.dataset_catalog() 並依分類輸出名稱+層級+說明；不再呼叫 client；更新工具描述與模組 docstring。 - src/finmind_mcp/client.py：移除 list_datasets()（壞掉的 /v4/datalist 呼叫）。 - chatgpt/openapi.yaml：移除 listDatasets operation、/v4/datalist path 與 DatasetList schema；只保留 queryDataset（GPT 用 knowledge bundle 認 dataset）。 - knowledge/instructions.md：移除「/datalist — 列出可用 dataset」錯誤敘述，改註明 FinMind 無此 API、完整清單見 knowledge_bundle.md。 - docs/spec.md、docs/mcp-original-readme.md：同步修正工具↔endpoint 對照表。測試： - tests/test_knowledge.py（新增）：驗 dataset_catalog 解析 ≥80 筆、含必要欄位、 Tier 說明 legend 不產生記錄、TaiwanStockPrice 為 Free。 - tests/test_tools.py：list_datasets 測試改驗從知識庫讀取且 client.calls 為空； FakeClient 移除 list_datasets/list_result。 - tests/test_client.py：移除 test_list_datasets；test_token_from_env 改用 query_dataset 驗證 env token。驗證：32 passed、smoke OK、build_instructions 7986/8000 chars、openapi 驗證通過。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>

linsamtw merged commit 1bd98e3 into master Jun 1, 2026
3 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix(list_datasets): 改讀內建 dataset 目錄，移除壞掉的 /datalist 呼叫#7

fix(list_datasets): 改讀內建 dataset 目錄，移除壞掉的 /datalist 呼叫#7
linsamtw merged 1 commit into
masterfrom
fix/list-datasets-from-knowledge

linsamtw commented Jun 1, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

linsamtw commented Jun 1, 2026

問題（已隨 PyPI 0.0.2 上線）

修正

測試

發版

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant