Box 創辦人 Aaron Levie 訪談心得:人為什麼還在 AI workflow 頭尾、企業 AI 導入為什麼比矽谷想的慢
Box 創辦人 Aaron Levie 訪談看完、整理 5 個值得停下來看的論點:Agent 為什麼還是要人在 […]

Gwarket. 將 AI 工作者需要的工具、方法、企業實務與思考框架整理成可回讀的週刊索引。這裡不是資訊流,而是一份持續編輯的知識目錄。
Box 創辦人 Aaron Levie 訪談看完、整理 5 個值得停下來看的論點:Agent 為什麼還是要人在 […]
用多個 AI 工具完成一件複雜任務,直覺會想讓它們無縫互通。但跑過一輪你會發現,這恰好是整套架構最容易崩掉的地 […]
微軟 AI Agents 18 課裡有 5 個章節是「怎麼蓋一個 agent」的設計層教材——Design P […]
Browser-Use(CUA)跟 MCP 是 2025-2026 AI agent 圈最熱的兩個題目——但官 […]
微軟在 AI Agents for Beginners 第 12 課直接把「Context Engineeri […]
「Agentic RAG」是 2025-2026 RAG 社群最常被誤讀的詞——多數人以為它是「加 agent […]
Claude Code 的客製化機制有 5 層——CLAUDE.md、Skill、Subagent、Hook、 […]
Claude Code 跟 Cursor、Copilot 看起來像同一類工具,用過之後會發現它根本是另一種東西 […]
用 Claude Code 用一陣子之後常會發現它越用越笨——但多半不是模型變差,是 context wind […]
摘要:「Claude 能用來做什麼」跟「Claude 能碰到什麼資料」是兩回事。Connector 把 Cla […]
摘要:多數人把 Claude 當成一個聊天機器人,這個比喻漏掉了 Claude 真正的設計重點。它不只是一個聊 […]
花一整天調查 AI Agent 架構,被自己的提問推了三次轉向,命題從「選哪種架構」升級到「設計一個不被工具綁住的個人知識系統」。完整記錄三次認知轉向、我歸納的四層架構(Markdown + Obsidian + MCP + AI 工具層)、以及三步執行方向。
大部分 AI 專案死在導入階段,不是技術階段。這篇記錄一套跨語言社群分析系統從 UAT(7 項測試 4 通過 2 不通過)到三階段 Rollout 規劃的完整過程。附 Adoption Metrics 框架和五份操作文件清單。
跨語言社群聲量分析系統跑通了 pipeline,但社群媒體只拿到 6 則可信資料。系統性診斷後發現:蒐集層的天花板是結構性限制,不是搜尋策略問題。研究業界做法後重新定位系統價值:分析和洞察層已驗證品質,蒐集層是可替換的模組。
跨語言社群聲量分析系統的架構設計紀錄。評估 CrewAI、LangGraph 後選擇純 Claude API + Python,因為線性流程不需要框架的複雜抽象。附資料來源技術限制調整、水軍過濾機制設計、技術風險評估。
品牌負責人不懂當地語言,怎麼掌握海外市場情報?從 As-is 流程的五個斷裂點、問題本質的三個缺口,到 AI 介入點定義和 MVP 切分的完整需求拆解紀錄。附產出品質對比和四個成功指標。
企業評估 RAG 導入的完整流程:200 份文件、五組對照實驗、從 Context Stuffing 93 分到 RAG 88 分的數據解讀。結論:小資料集不需要 RAG,大規模才是 RAG 的價值所在。附六個技術決策 trade-off、品質診斷方法論、不同規模下的最佳方案選擇。
RAG 系統從 77 分優化到 88 分的完整記錄。Query Rewriting 讓 Retrieval Failure 減少 60%、Type A 達到滿分 5.00。六方比較表顯示 RAG v2 追平 Context Stuffing,但能處理 3.8 倍資料量。附優化決策過程和 20 題樣本局限性分析。
逐題標記 100 個 chunks 的檢索相關性,發現 60% 品質問題來自 Retrieval、Generation Failure = 0。Retrieval Precision 從 Type A 的 36% 降到 Type C 的 16%,Hybrid Search 互補效果只在 40% 題目有效。附三大優化方向和理論上限推導。
用 200 份文件跑四組對照實驗:Context Stuffing 14 檔 88 分、64 檔 93 分、關鍵字搜尋 59 分、RAG Hybrid 77 分。RAG 用 2% 資訊量達到 83% 效果,是唯一能處理 462K tokens 規模的方案。附不同規模下的最佳方案選擇指南。