20250312周报

日报

20250306

阅读ChatDev代码,检索了解manus。

20250307

突发奇想写了个简单的minecraft-codeforces agent,检索了解cursor。

20250308

阅读论文《SOCIODOJO: BUILDING LIFELONG ANALYTICAL AGENTS WITH REAL-WORLD TEXT AND TIME SERIES》,学习有关agent环境搭建的内容。

20250309

继续阅读,这论文怎么还自己造词呢,真莎士比亚啊。给校内老师帮忙出了点算法题。

20250310

论文阅读收尾,写论文summary。qq群里出现了一个神级bot,我快要分不清了。

20250311~20250312

阅读论文代码(代码质量令人遗憾),跟学院团委吵社团名字。

Sociodojo 论文阅读

论文链接

Summary

Sociodojo由四部分组成,信息来源、时间线、知识基础和工具箱。(1)
Task设计:基于一个简单逻辑,从可观测的 wt 推导出隐藏的 st(透过现象看本质)。考虑到消息传递需要时间,因此隐藏的 st 往往是过去的。(3.1.1)。
(index,metadata,messages) metadata是一个消息的summary,方便模型确定是否需要去看(3.1.1)
?(3.1.2)真没看懂,怎么感觉跟3.1.1没大区别,有点不懂。
sociodojo的信息来源主要是爬了一堆新闻媒体,金融数据,各种调查报告(顺便提了google数据的特殊处理,遇到相同的可以借鉴);
讲了一些关于知识库的处理手段,以及(看起来很简陋的)工具箱的组成。(3.2.1)
世界运行器(很像瘟疫公司啊)和经纪人机制(限制一些不合理的交易)(3.2.2)
时间序列库由ChromaDB和Instructor-XL实现为两个向量数据库作为嵌入模型,利用该模型嵌入自然语言查询,然后计算其与数据库中存储的片段的嵌入的内积距离,并返回最佳候选。对于知识库,片段是第3.2.1节中讨论的分段文本;对于时间序列,代码片段是时间序列的代码及其描述,允许智能体找到所需时间序列的代码。这里想学习一下原理以及代码是怎么写的(4.1)
思路来源于零知识证明,我一直很感兴趣它的原理和基本知识,但一直没去了解。
分析师会做出猜测?–假设证明H&P(4.2)

每天下课回宿舍的路,没有什么故事。
每天下课回宿舍的路,没有什么故事。