过程即奖励

作者

过程即奖励

15
读者
287
内容

每天脑子里的念头都会在这生根发芽 因上努力,果上随缘 | 挥舞剑的人 | journey is the reward lollapalooza

全部文章
作者过程即奖励头像

过程即奖励

2024/09/26

Albert关于时代注脚的播客

大模型时代还在早期充满不确定性 alber给出的答案

找到正反馈的业务 通过能打赢的小仗 加深积累对ai的理解

做短期做到你可以并行做长期的时候再做长期

<......
作者过程即奖励头像

过程即奖励

2024/09/26

大模型 公共知识 vs 私人数据

大模型是所有人都可以用的公共知识 就是生产工具的平权。

真正有价值的是你的独特性,而你的独特性正是来自你的私有数据、你的独特知识。

作者过程即奖励头像

过程即奖励

2024/09/25

企业落地AI 核心能力积累

核心竞争力积累为下面几个:

    1. 数据资产,这个的定义是定义:未来可用的数据才叫数据资产 (数据资产是不是优质的判断:是不是可以快速呗......

作者过程即奖励头像

过程即奖励

2024/09/22

大模型 -- 硬件

我们确实需要一个不用从口袋里拿出来、又具备所有 AI 所需传感器的设备。

特别是满足细分需求..

在大模型时代 大家大大低估了 传感器的价值

作者过程即奖励头像

过程即奖励

2024/09/15

盲目的乐观 只关注终局忽略边际是一种偷懒

作者过程即奖励头像

过程即奖励

2024/09/15

投资 - 右侧与不贪心 环境与表向

投资需要的是笑到最后,活到最后,投资是最不需要逞英雄的领域,不要去对抗市场,对抗市场这个事情本身就很搞笑。顺势而为,是最高的安全边际,管理好风险,投资就成功了一半。

审时度势,见机而......

作者过程即奖励头像

过程即奖励

2024/09/15

大模型 - o1 vs 4o

4个能力 文字表达(甚至多模态生成) 记忆(历史具备知识 和 缓存新知识) 推理 多模态输入识别

4o更多是多模态 o1是推理

用到了更多强化学习的方式去训练,cot内化......

作者过程即奖励头像

过程即奖励

2024/09/09

大模型 - coding的平权

llm让编程这个生产力工具实现平权 所有人都可以让写代码变成自己生产力提升的方式

因为有LLM 甚至是LLM - action的方式 所以完成任务不用复杂逻辑判断

ag......

作者过程即奖励头像

过程即奖励

2024/09/06

大模型 prompt - 代码 - action

有一种思路很有意思, predict next token为基础的LLM在数学运算和输出一些表格等类型输出结果不好, 但是LLM写python可以表现很好。

所以假如......

作者过程即奖励头像

过程即奖励

2024/09/04

大模型 - LLM based 外呼

关于voice agent 和 LLM based语音外呼的看法

和纯文字比主要几个核心点:声纹 / 打断处理 / tts时延 / 整个 asr-llm生成回复-tts工程上的时间延......