想记录一下最近参加的两个和AI 有关的会。一个是华源的,算是硅谷最大的中国人工程师协会。另一个叫ODSC (Open Data Science Conference),我去年也参加了,今年是第二次。另外,今天的日记的题目起得很大,其实是个噱头,但是算是对我自己的噱头吧。人工智能的发展实在太快,没有人可以知道全部,三个月之后,我今天所说的,很可能已经成为历史–就让这份所谓的报告成为一份历史报告吧。另外,这份报告里有很多是我自己的联想,猜测和推演,所以这并非一份诚实的报告。纯粹是想记录一下,让几年之后的自己回头再看的时候了解我究竟是否有对未来的洞察力。

【教育】

  • 教育的现状令人担心。目前的 ai 并不能改变基础教育的效率。问题在于小孩子还难以学会如何使用 ai。但是我们可以用 ai 去训练老师,让他更好的教小孩子。同样的方法可以用在心理理疗师身上。
  • 未来的人的能力更多的取决于两点:使用 ai 的能力,和使用 ai 去学习新的知识的能力。

【危机】

  • 如何理解ai 对人类的危害:ai 所拥有的知识更是超越大多数人的。我们普通人是否真的理解了ai 所带来的社会,职业,科研方面的革新?或者是革命?讨论这个问题的人很多。简单的归纳就是:超级 ai 很有可能出现,能够全面引领人类的研究。以前使用 ai 是在纷芜复杂的研究路径中找到最可能的突破口,自动筛选掉错误的路径。比如复合材料研究,基因研究,如此等等。但是如今 ai 已经进化了太多,在人类输入了某些基础的研究原则方法论之后,ai 的学习速度极大提高,其甚至进化到可以指导人类进行下一步研究,或者直接解决某个问题 — 直接提供答案。在这种“超级智能”的 ai 面前,人类所有的问题几乎可以立马得到“正确”的答案 — 这也是硅谷大公司不惜血本也要赢得这场 ai 竞赛的原因。这次听到的演讲里面,有些说的是数学方面的研究,如何利用 ai 得到了更迅速的研究结果,虽然人类未必做不出来,但是在时效上可能慢了两个数量级,特别是在工程数学应用方面。还有些是在算法优化方面,更是能够提出一些新的算法,而人类算法学家已经有很长时一段时间没有提出新的算法思路了、、、如果说要延伸拓展一下就是:ai 很可能提供了一个弯道超车的机会,又或者提供了一个让对手永远也无法企及的加速发展的机会。看到了ai 的能力的人,无法不被震撼,也无法忽略它带来的颠覆性的后果。
  • ai 的不安全是全方位的,从底层的模型,到用户请求,数据嵌入,及时更新,乃至于中间介入,处处是漏洞处处是风险。如何增加 ai 的信任度,将是一个长期和复杂的过程。而 ai 如果撒谎,人类将缺乏辨别能力,从而产生社会性的风险 — 或者说,ai 的造谣能力将是指数级的增加和指数级的难以防御。
  • 大数据之下,个人隐私无所遁形。ai 之下,人类没有隐私,甚至连未来的隐私都会被泄露(有点危言耸听了,但是预测人的行为本身也是 ai 的功能)
  • ai 危机之下,人类未必没有机会。重要的是角色的转换。ai 如果成为工作同事,我们就成为了做决定的人。在更好更深刻的理解公司方向的情况下协调部门团队 — 犹如军队的士兵已经是机器人了,那么人就成了天然的管理者,而只有能够领会上级意图的管理者才有生存的机会。未来的竞争,是决策机制和战略层面的竞争。
  • 超级智能:我们已经非常接近了。也许,改变世界的终究是某个人,或者某个拥有超级智能的公司,组织,或者权力机构。
  • ai 智能如果可以分级的话,我们现在在三级半,最高是五级,而到第四级的时候,ai 已经在影响重大的公共决策了,公司和商业之间基本上都是智能体在进行数据交换,考验公司生存的是战略决策的选择,颇有生死时速的感觉。第五层无法想象。
  • 另外一个讨论超级智能的预测在 2030 年左右会出现超级智能。然而其带来的风险则要大过自然灾难带来的风险和损失,诸如化学武器,大型系统入侵,信息传导扭曲,误导,诱导和谣言控制,政府控制或者政府职能劫持,等等。

【科研】

  • 情境工程(Context Engineering): 去年的时候最火的是“提示工程(Prompt Engineering)”。今年的概念已经往前走了一步。换句话说,作为 llm(大语言模型)为底层的应用,在使用上已经再迈进一步。如何提问(prompting)仍旧重要,但是提供一个场景,一个故事,一个圈定的氛围,而后让 llm 根据这个来提供更准确的回答,让 ai 拥有“代入感”,从而提供更加合理,逻辑自洽和完整的回答。我进一步的联想是,以后的机器人能够真正的进入人的某个角色,然后提供“合情合理”的答案将成为现实(当然需要解决“记忆”这个问题,这仍旧是正在激烈的往前推进的课题)。这份演讲提到了如何构造”Context”的详细的技术路线,也提供了在提供场景之后的 ai 的工作效率:的确非常惊人。ai 已经可以提供合理的建议,找到复杂的逻辑错误并提出修正了。而且 ai 的优势是能够在大量的背景资料中筛选有用的信息。作者提供的是编程方面的示例,但是我能够看到其在谈判,甚至是法律诉讼方面的巨大潜力。至于将来法庭上是否有一个 ai 律师助手,我不得而知,但是这里隐含了巨大的想象空间。
  • ai 走向 ei(工程智能):传统 ai 是建立在海量数据和预测上,ei 则是学习问题的解决方法论,而后在方法论的基础上解决问题,而不是基于现有的解决方案的引申。简单的说,我们教给了ai 如何思考的方法,而后 ai 根据这些方法解决问题。甚至于能够教给人类如何解决问题。利用穷举法将不同的方法论组合之后不断尝试,而且能够根据反馈机制调整策略。唯一的缺点是它还不能提出新的方法论,只能组合现有的方法论– 给了我一点安慰。然而其研究的速度已经远超人类。而绝大部分人类的研究都是基于现有的方法论,而不是提出新的方法论。其速度和洞察力,已经超越了绝大部分人类顶尖的研究员(这一条没有数据,只有个案)

【应用】

  • yutori.com : scouts:这是一个浏览器的 agent(智能体)。能够代替个人不断的访问同一,或者多个网站,收集数据,写摘要报告,或者执行某种固定程式的操作。诸如:看某人的博客,追踪某个数据,价格,产品发布,个人履历,甚至定位,买机票、、、。你可以将之想象成自己的分身,在互联网上(或者公司内部网络)代替自己参与活动,无论是读新闻,看股票,做研究,甚至参与社交互动。就展示而言,已经很成熟。不过资源消耗很大,目前是邀请制 — 我想引申的一点是,上一次看见的研讨会里面,mit 的教授有展示一个内部实验,也就是一个纯粹的智能体(ai agent)的互联网,没有人的参与,只有各种智能体之间进行信息交换,汇总和实操。也许将来的互联网不再是人的网络,更是 ai 代理人的网络。
  • derwen ai:只需要基于公开信息,洗钱就已经基本上无可遁形了。这是一项远超大数据本身的追踪机制。(但是也许没有人真的用它,而是作为某些公益组织的呼吁的工具)
  • 语音 ai 作为新的界面,已经有了巨大的进步,诸如即时翻译,同步异语输入输出。也许语言障碍将消除,但是语言能力的差异将一直存在(仍旧会减少)
  • 语音 ai 将是未来最重要的人机交互界面,而且无所不在。

【技术】

  • Orchestration: 模型固然重要,但是模型之间的合作交流和应用层面更加重要。以后的 ai,需要几十个或者上百个大大小小的模型相互协同和匹配,以便更好的服务人类。
  • ai 模型如果能够大规模应用,开源是最好最安全的选择。但是开源和商业闭源必将长期共存。
  • 每个人都需要学习 ai,而 ai 的精髓在于信息共享和流通。效率的提升在于信息的流通速度和阻隔的减少。建立企业内部的统一的 ai 平台势在必行。而这也许就是未来的公司架构重构的方向。
  • deep agent(深度智能体):智能规划,协调多个专业智能体,多层次的内容和决策架构 (sub-agent,mcp,plan,记忆以及记忆载体)– 这个有点复杂,暂时先记录这两点。
  • 生成式 ai 的大型决策机制架构。
  • vibe coding:ai 编程已经并且将继续改变社会
  • 如何建立稳定的底层 ai 架构:底层 ai 架构将成为公司的架构刚需。一个人的亿元独角兽公司将成为可能。
  • 发展 ai模型的瓶颈之一是评测 ai模型的工具。没有好的评测工具,ai 发展难以推进。

再次特意说明一下:上面这些有些是忠实的记录,有些是我当时发散出来的思维。所以整体不够严谨。姑妄听之。同时,而我参加的这个也并非顶级程度的 conference,勉强算是中上吧。很有一些技术大牛,公司高层,和知名教授,但是还不够顶级。

算是一个历史档案吧。