Study Notes: o1 Reasoning Models and Post-Training Reinforcement Learning (RL)1. Introduction to o1 Reasoning ModelsSep 20, 2024Sep 20, 2024
意識、非意識智能及其動態:確保在無限遊戲中的穩定與合作最近讀了彼得·瓦茨 (Peter Watts) 的小說《盲視》(Blightsight) 的書摘,其中 "意識僅是副產物" 的重要的概念,觸發了我一連串對於現今社會邁向 AGI 的時代面對課題的探討。Aug 3, 2024Aug 3, 2024
Consciousness, Non-Conscious Intelligence, and the Dynamics of AI: Ensuring Stability and…Recently I read the book review of Peter Watts’ novel “Blindsight” and the concept that “consciousness as a byproduct” triggered me to dig…Aug 3, 2024Aug 3, 2024
生成式AI的既定風格與瑕疵用過各種AI生圖工具的人,應該都有經驗,即使它可以生成相當驚艷的作品,但它的限制、不受控與瑕疵,如果要拿它來用在工作上,還是蠻不容易的一件事。這點我在做了 AI Agent 自動創作小說之後更有感觸。Apr 5, 2024Apr 5, 2024
實作 AI 代理 — 以長篇故事為例這兩天終於有機會可以做 AI Agent 程式。重點是體驗 AI 代理實際會遇到的挑戰。體驗的心得簡單兩點:(1) 商用性還有很大距離 (2) AI 召喚師不比程式設計師好當。後面會詳細分享。這次使用 CrewAI 這個開源計畫撰寫,成果是給一個幾十字的故事大綱,可以在 10…Apr 5, 2024Apr 5, 2024