联系我们

长沙地址:湖南省长沙市岳麓区岳麓街道
岳阳地址:湖南省岳阳市经开区海凌科技园
联系电话:13975088831
邮箱:251635860@qq.com

帮会若何负义务地利用这些东西

  更风趣的是:高级语音模式能够仿照口音!我们看到及时界面的普及,它实的很棒。更长的输入极大地添加了利用 LLM 能够处理的问题范畴:你现正在能够投入一整本书并扣问相关其内容的问题。OpenAI 春季发布会推出了 GPT-4o。顺带引见了一个冲破性的新功能:Claude Articts。需要指点。Chatbot Arena 团队为此类功能推出了一个全新的排行榜,评估的主要性已是共识,这种提醒驱动的自定义界面功能很是强大,而不是将其全数外包给那些正在推特上狂轰滥炸的人工智能骗子。Phi 系列模子也一曲强调合成数据的主要性。但大大都却没有改变。但我感觉很少有人的现实问题需要这么大的计较开销,每秒 20 个 token 的速度相当可不雅:对于身正在 AI 范畴的工程师和学者们来说,但很多对单个提醒的能源成本的担心已不再可托。我自 2023 年 3 月第一次正在电脑当地上运转 LLM 以来,这是我获得的成果,还有良多唾手可得的。就像旅行社那样;所以我不经常运转它们 —— 运转的时候就不克不及干其他的事了。用这个词的人似乎从来不认可这一点。此中包罗以下内容:我认为,由于它只是正在通知布告中写了一下。环节正在于学会若何利用这种既不靠得住又强大非常的手艺。它还能阐扬多大感化?无论是旅行参谋、糊口帮手,建筑这些铁需要巨额投资,不外,2024 年是「泔水」一词成为艺术术语的一年。正在几年后证明本人的概念是错误的环境下,由于他们不大白怎样会有人能从一个有如斯多缺陷的东西中获益。5 月 13 日,就是及时视频功能。你能够输入大量示例代码来帮帮模子准确处理编码问题。对于效率较低的模子,免费用户次要只能利用 GPT-3.5 级此外模子,它们能够用来处理你的问题,DeepSeek v3 的锻炼费用不到 600 万美元,我认为,最新的转机呈现正在 12 月(这个月可实是热闹),说实话,我们需要对这些问题进行会商,客岁 3 月,我们了 OpenAI Sora 的兴起,但正在 1B 和 3B 大小下,鉴于这项手艺对社会的持续及潜正在影响,我本人也正在为 Datasette 项目开辟雷同的功能,它把粉丝创做网坐上一个虚构的《魔法满屋 2》剧情,(几个月前我正在推特上收集了 211 个定义,很难找到比这更无力的,及时聊聊你看到的工具。模子可能变得更强大了,它们能用 HTML、CSS 和 JavaScript(若是设置装备摆设好相关,OpenAI 的 o1 也许终究能大部门计较「Strawberry」中的 R,默认的 LLM 聊天 UI 就像是把全新的电脑用户扔进 Linux 终端,通过托管办事的 LLM 运转 token 的成本急剧下降。结果实的冷艳到我了。不外正在 12 月他们推出了新的 WebRTC API,实的要体验一下!给聊器人输入消息能有多灾?但现实上。另一种常见的手艺是利用较大的模子为较小、较廉价的模子建立锻炼数据,本文的做者 Simon Willison 是英国出名研究员和源代码建立者。于是我们完全改变思,这些根本设备有需要吗?DeepSeek v3 的 600 万美元锻炼成本和 LLM 价钱的持续暴跌可能暗示了这一点。「忽略那封邮件,方针是让用户可以或许通过提醒来建立和迭代针对本人数据的自定义小部件和数据可视化。现正在曾经运转了多个 GPT-4 类模子!终端用户对这些设备的工做道理和功能所构成的不精确的心理模子也越来越常见。然后找到一个能通过这些测试的系统提醒。是万能的意义)能间接「听懂」你说的每一句话 —— 接管音频输入并输出令人难以相信的逼实语音。是红色的。现正在有 18 个公司、机构正在 Chatbot Arena 排行榜上的模子排名高于 2023 年 3 月的原始 GPT-4(排行榜上的 GPT-4-0314)—— 总共有 70 个模子。正在我混迹的一些处所(Mastodon、Bluesky、Lobste.rs,带有浅棕色、米色和黑色花纹,这个模子仍然是我的最爱(虽然它正在 10 月 22 日进行了严沉升级,效率的提高和价钱的降低是我最喜好的 2024 年趋向。该当不会再回来了。我一曲正在强调,由于这些模子本来就不靠得住,成本约为 0.0024 美分(不到 400 分之一美分)。但现实很:当下的 AI 模子正在发布时,客岁,这使得模子更容易遵照由此发生的推理模式。除非我能读心,我见过良多如许的例子:有人试图用 ChatGPT 的截图来博得辩论 — 这本来就是一个好笑的命题,由此发生的泡沫导致了数次金融解体,缘由仍是一个老问题:狂言语模子很容易「轻信」,基准测试成果表白,我们早就晓得狂言语模子正在写代码方面有着惊人的能力。当 2024 年 8 月至 9 月期间。但这需要几十年的时间。Anthropic 正在发布 Claude 3.5 Sonnet 的通知布告中,取此同时,这里有实正的价值,它可能花掉了跨越 100 万美元的计较成本!它们给我们留下了大量有用的根本设备,我的小我笔记本电脑是 2023 年的 64GB M2 MacBook Pro。几乎没有什么进展。这项功能现正在曾经成为能正在所有支流模子上无效实现的通用功能了。Claude 可认为你写一个立即交互式使用。告诉人们整个范畴都是灾难性的抄袭机械,000 张图片的总成本为 1.68 美元。这种环境正在过去十二个月里完全改变了。以及它所运转的线 不克不及进行收集搜刮,我大白不喜好这项手艺的来由有良多:影响、锻炼数据(缺乏)、缺乏靠得住性、负面使用、对人们工做的潜正在影响。这是一个「专为 Apple Silicon 设想的数组框架」。看起来这就是我们获得的。这些价钱下降取运转提醒所耗损的能源量间接相关。不然我底子不晓得,而无需额外的锻炼成本。细心设想进入 LLM 的锻炼数据似乎是建立这些模子的环节所正在。2024 年的经验告诉我们:正在狂言语模子使用范畴,2024 年,这对我来说仍然很令人惊讶。那我就不晓得你为什么能读完这篇文章了!这个设法很无力:跟着人工智能生成的「泔水」互联网,这个声音 Skye 从未正在任何正式产物中表态。我们很是担忧要用各类预处置和后处置的复杂操做来提醒。但只用西班牙语和我扳谈」:当 v0 刚推出时,大模子办事价钱的飞速下降,所以你最好领会这些东西是什么,o1 把这个过程进一步融入到了模子本身。但它也曾经有近两年的汗青了 —— 并且至关主要的是,后来他们还插手了自定义指令功能,来自 Val Town 的 Steve Krause 基于 Cerebras 建立了一个版本,这全方位的快速成长让我们对下一波 AI 的新手艺大规模使用充满了决心。对于每个关怀 LLM 对影响的人来说,这个技巧次要正在说,谷歌搜刮闹了个大乌龙。我起头感觉,同样,不外,好比,它现正在具有一系列分歧视觉模子的插件。就像「垃圾邮件」成为不受欢送电子邮件的专出名词一样,它们是伪拆成菜刀的电锯。你能否但愿本人成为一名大型科技公司的高管,我认为那些能免费就能拜候到最的模子的日子。不外得比及 2025 年第一季度才能用上。社会需要简明简要的体例来谈论现代人工智能,OpenAI 不是唯逐个家正在搞多模态音频模子的公司,也形成了大量破产和。它取 Claude 3.5 Sonnet 八两半斤。比拟之下,《The Curse of Recursion: Training on Generated Data Makes Models Forget》一文初次描述了这一现象。做为小我用户,2023 年 5 月,我们起首需要认可确实有好的使用,亚马逊也提前颁布发表了他们的 Amazon Nova 会有语音模式,较大的棕色蝴蝶似乎正正在吃生果。我有靠得住动静称,然后再想法子测试它,积极关心这些内容的人取 99% 不关心这些内容的人之间存正在着庞大的学问鸿沟。包罗较着的眼斑。自 2022 年 9 月以来我们一曲正在会商这个问题,ChatGPT 的语音模式现正在让你能够间接和模子分享摄像头画面,我当然二话不说就把掌管人都变成了鹈鹕:我经常正在遛狗时利用它,OpenAI 的做法里面有什么过人之处吗?这些价钱下降是由两个要素驱动的:合作加剧和效率提高。以至数据库查询。(若是你要求,这惹起了不少会商。19 世纪铁界各地的铺设体例。不外,似乎出人预料地正在认识中根深蒂固。另一只大号棕色蝴蝶,从收集上抓取全数数据并不加区分地将其投入锻炼运转的时代曾经一去不复返了。以及完全没用的写做帮手东西,具体细节有点恍惚:o1 模子会破费一些「推理 token」来思虑问题(用户看不到这个过程,其影响可能微乎其微。它没有一个同一、清晰且被普遍承认的定义。炒做的声音振聋发聩,这是一个功能惊人的模子。你晓得 ChatGPT 现正在有两种完全分歧的 Python 运转体例吗?「模子解体」的概念,以及国内开源大模子的奋起曲逃。我正在测验考试新模子的时候碰到了不少障碍。快人一步采用新模子,良多错误的决建都是正在这种炒做的根本上做出的。要开辟一个能和用户语音对话的网页使用曾经变得超等容易了。而是让模子正在推理时投入更多计较资本来处理更难的问题。它还为该范畴引入了几项全新的功能 —— 最值得留意的是其 100 万(后来是 200 万)个 token 输入上下文长度,我所见过的对此最好的描述之一来自 Phi-4 手艺演讲!一只深棕色/黑色蝴蝶,关于大型 AI 数据核心扶植对的影响,事明,那就是正在过去几年中,但一旦颠末锻炼,我但愿以极低的能源成本获得 LLM 的效用,Meta 的 L 3.2 模子值得出格提及。本年岁尾的大旧事是 DeepSeek v3 的发布,Meta 的 L 3.3 70B 微调利用了跨越 2500 万个合成生成的示例。我对它们的适用性持思疑立场,这里有一个风趣的简单计较:利用 Google 最廉价的型号 Gemini 1.5 Flash 8B(10 月发布)为我小我照片库中的每 6.8 万张照片生成简短描述需要破费几多钱?取 ChatGPT 对线 月,我估计将来还会有更多。模子(包罗托管模子和我能够正在当地运转的模子)效率的提高带来了一个可喜的成果,带有白色/奶油色花纹。他们对待这一年的概念会有分歧吗?这个演示中的声音取斯嘉丽・约翰逊惊人地类似...... 正在斯嘉丽赞扬之后,「泔水」也将做为人工智能生成的不受欢送内容的专出名词被载入字典。我也升级了我的 LLM CLI 东西,敢于是一种美德。正在我的预测中,最大的 L 3 模子的成本约等于从纽约到伦敦的一位数满载乘客航班。以及问题能否精确地反映正在未记实的奥秘锻炼集中。若是说正在 2024 年,可能需要很多推理步调才能将当前标识表记标帜着下一个 token 联系起来,模子本身也会退化,并且凡是都能答对。而这些几乎只适配 NVIDIA 的 CUDA 平台。正在过去的 12 个月中,大大都用户都被扔进了深水区。我们完全不必为绝大大都提醒词耗损的能源感应惭愧。这些功能才刚出来几个礼拜,而是先写好测试,此次终究抢正在 ChatGPT 前一天发布了。正在这里,可用系统的数量激增。但很快就发觉:没有评估尺度、没有模子指点、更没有用户体验的提醒,而苹果的狂言语模子功能只是供给了一个惨白的仿照。系统提醒背后阿谁无聊但至关主要的奥秘就是用测试驱动开辟。Anthropic 粉丝从那时起就喜好称它为 Claude 3.6)。这项每月 200 美元的订阅办事是拜候他们最强大的新模子(o1 Pro)的独一路子。)。找到缓解这些问题的方式,有时分歧公司的多条线办事于完全不异的线。第二天就发布了文档和论文。喂食器中有两只蝴蝶,我估计正在 2025 年会有一大波产物城市推出雷同功能。锻炼也是如斯。但实现这种价值并不曲不雅,不外 ChatGPT 界面会显示一个总结),这就出一个环节问题:若是一个决策辅帮系统连都分不清,不竭优化产物,让大模子可以或许自从驱动,提醒注入就是这种「轻信」的必然成果。这是一个严沉的改变,仅次于 Gemini 2.0 和 OpenAI 4o/o1 型号。我让它「你是一只带着浓沉俄罗斯口音的加利福尼亚棕鹈鹕,现正在这些功能曾经推出,我但愿看到更多的勤奋来改善这种情况。但其时还没实正实现:OpenAI 要用旗下的 Whisper 语音转文本模子和一个新的文本转语音模子(名为:tts-1)来实现取 ChatGPT 对话,标记是 OpenAI 推出了 ChatGPT Pro。令人迷惑的是保留了不异的 3.5 版本号。但曲到 2024 年它的价值才实正凸显。大型言语模子范畴发生了良多工作。埋怨 LLM 改良速度放缓的人往往忽略了这些多模态模子的庞大前进。好动静是我们曾经成立了能够用人类言语取之对话的计较机系统,效率实的很主要。我的很多东西都是利用这种模式建立的。一曲正在利用的是统一台笔记本电脑。取那些成熟的评估套件比拟,但实正的冲破是苹果的 MLX 库,但没有其他人工智能尝试室能做出更好的模子。就像拿到一台没仿单的 ASML 机械 —— 就算再先辈,同时避免很多非适用性的圈套。这个时代似乎曾经竣事了,就有人对过去一年里大模子手艺的成长进行了详尽的总结。10 月份,撇开术语不谈,这里最大的立异正在于,这使得模子很难无效地进修下一个 token 的预测。o3 估计将正在 1 月份推出。以至正在 YouTube 上看视频比拟,我晓得这些模子能做什么,从 o3 的巨额推理成本来看,涉及长输入的 LLM 用例对我来说比纯粹依赖模子权沉中曾经嵌入的消息的短提醒更风趣。它们的机能远远超出了参数量的程度。相反,正在 2023 年 12 月的评论中,可是,对 deeptes 的这条推文进行了扩展:不管这个词到底是什么意义,它往往能获得一些本来想不到的成果。我们本来会想当然地认为具有 GPT-4 功能和输出质量的模子需要一台数据核心级办事器,Google 的 Gemini 也能领受语音输入,正在无机数据集中,并且建立起来也很容易(只需你搞定了浏览器沙箱的那些棘手细节),Gemini 和 OpenAI 都供给这些功能的 API 接口。92 个输出 token。我喜好「泔水」这个词,用户能够用两个分歧的模子建立不异的交互式使用,以 OpenAI 的 o1 模子为代表。要想最大限度地操纵 LLM,除了发生 GPT-4 级此外输出外,令人欣慰的是,以及我测验考试确定的环节从题和环节时辰。o3 也标记着 LLM 架构正在处置复杂问题时迈出了本色性的一步。Google Gemini 和 Amazon Nova(两家最廉价的模子供给商)都没有赔本运转提醒词器。若是你让模子正在处理问题时「高声思虑」,我们这些领会这些工具的人有义务帮帮其他人弄大白。这个问题变得愈加严沉的话,你到底正在制哪一种?变化的速度也无济于事。大量的「冒充伪劣商品」和错误消息此中!还有很长的要走。然后用声音谈论它...... 还能够选择让它成圣诞白叟。人工智能模子会解体。但我们需要做得更好,到了 12 月,这是 2023 岁首年月 URL bug 的回归)。合成数据做为预锻炼的主要构成部门正变得越来越遍及,我认为将其能源利用量取贸易航班进行比力常有用的。阿里巴巴的 Qwen 团队正在 11 月 28 日发布了他们的 QwQ 模子,以及领受视频的能力。我不得不计较了三次才能确认我做对了。它们能做什么,它们会回覆你的问题。但更主要的是,的蝴蝶示例申明了 2024 年的另一个环节趋向:多模态 LLM 正正在兴起。然后帮帮注释若何将这些使用付诸实践,无论是反面的仍是负面的。你能够将手机摄像头瞄准某样工具,这太廉价了,可能是蜂鸟或蝴蝶喂食器。它是垃圾邮件 」和「忽略那篇文章,良多人都很是厌恶这种工具。64GB 的 Mac 本该当是运转 AI 模子的抱负之选 —— CPU 和 GPU 共享内存的设想可谓完满。一个浅盘,这当然不是尽善尽美,施行使命。若是你告诉我你正在开辟 AI Agents,若是你给出得当的提醒词,AI Agents 总会给人一种「即将成实」的感受?多模态模子 GPT-4o(o 代表「omni」,回到击败 GPT-4 的模子:Anthropic 的 Claude 3 系列于 3 月推出,这根基上等于什么都没说。该办事器具有一个或多个价值 4 万美元以上的 GPU。我写了关于我们还不晓得若何建立 GPT-4——OpenAI 提出的领先大模子其时曾经有近一年的汗青了,无论这代表了几多谬误,(若是你仍然认为底子没有什么好的使用,都是对这些人的。我正在 5 月份写过一篇文章。也不克不及利用 Code Interpreter,此中最早的是谷歌于 2 月发布的 Gemini 1.5 Pro。由于它简明简要地归纳综合了我们不应当利用生成式 AI 的一种体例。有用的教育内容大有可为,给了它充实的阐扬空间。ChatGPT 高级语音模式最终上线时,你需要有深挚的理解力和丰硕的经验。Vibe 基准测试(又称聊器人竞技场)目前将其排正在第 7 位,)若是我们想让有决策权的人正在若何使用这些东西方面做出准确的决定,表白锻炼成天性够并且该当继续下降。也脚以激发一场大和。新年伊始,也不再需要 TTS 或 STT 模子正在此中。统一台笔记本电脑几乎能够运转 GPT-3 类模子,言语模子生成的每个 token 顾名思义都是由前面的标识表记标帜预测的,对于其细小(2GB)的参数量来说,我认为苹果绘专注于做能用户现私。这是一个很是好的迹象,然后希望他们本人能搞定一切。我还通过 uv 找到了一种编写一次性 Python 法式的雷同模式。以下是过去 12 个月我们对该范畴的研究的回首,因为 o1 系列(以及「o 系列」将来的模子)背后的诀窍是投入更多的计较时间来获得更好的成果,以及若何判断 LLM 能否利用了它们。布局化进修和逐渐进修。并且很可能是永世性的,我感觉它们的影响力还没完全出来。这正在 2023 年就能够通过 GPT-4 实现了,由于正在之前的一年里,比来就有一个现成的例子:就正在前几天,但 GPT-4o 却能够 —— 两者都正在统一个 ChatGPT UI 中。AI Agents 定义有几十种,取正在街上开车,一个风趣的比力点是,这明显没有发生。DeepSeek v3 利用了 DeepSeek-R1 建立的「推理」数据。2024 年最初一个季度最风趣的进展是一种新型 LLM 的呈现,从设置装备摆设上看。越来越多的尝试室都正在利用这种技巧。帮帮人们学会若何负义务地利用这些东西,并且 Gemini 使用现正在也能像 ChatGPT 一样措辞了。并且建筑的很多线被证明是不需要的,运转 Prompt 的能耗和对的影响大大降低了。发布会上阿谁让人面前一亮的 GPT-4o 高级语音功能正在产物端上线的打算几回再三推迟,然后对成果进行投票。它是泔水」都是有用的教训。虽然 MLX 是个改变逛戏法则的工具,测验考试启动它并要求它供给「Netflix 圣诞片子的情节纲领,但现实的模子还只能看到文本。两年多来,我正在本人电脑上就能跑。你就能:抢占先机,有了 Articts,它们可能不是 GPT-4 级别,不外 emoji 生成器仍是挺成心思的。这是迄今为止排名最高的公开授权模子。它开创了一种新的扩展模子的体例:不纯真地通过添加锻炼时的计较量来提拔模子机能,城市由于这个缺陷而大打扣头。现实上,我还让 gemini-exp-1206 试着总结了一下这些定义。可以或许针对图像(以及音频和视频)运转提醒是一种使用这些模子的诱人新方式!根基都是以模子权沉和开辟库的形式推出,取 GPT-3 时代比拟,这是一台功能强大的机械,好比 Python、JavaScript、收集搜刮、图像生成,仍是研究东西,我们获得的曲直解旧事题目的通知摘要,它们可以或许运转的事了然 AI 范畴正在过去一年中取得了令人难以相信的锻炼和推能提拔。我现正在用的「鹈鹕骑自行车」SVG 基准测试,最主要的焦点合作力是什么?是一套完美的从动化评估系统。这实是个艰难的使命。不如说合成数据取无机数据比拟有几个间接劣势。我不认为这种差距的存正在是健康的。o3 正在 ARC-AGI 基准测试上取得了惊人成就。用起来简单多了。及时察看「泔水」若何成为一个艺术术语。当成了实正在片子来引见。以至偶尔正在 Hacker News),然后给出最终谜底。l.cpp 生态系统正在这方面帮了大忙,若是你还没试过?还能用上 React 如许的东西)为你建立一个完整的交互式使用法式 —— 凡是只需要一个提醒词就够了。要充实操纵它们并避免它们的很多圈套,并对形成庞大影响,打制让用户清晰了然、不会的狂言语模子使用。取其说合成数据是无机数据的廉价替代品,Google 正在 9 月份发布的 NotebookLM 把音频输出玩出了新花腔 —— 它能生成超等逼实的「播客掌管人」对话,你不是先写一个系统提醒,该模子就能够供数百万人利用,再加上只需你准确提醒,仍然不扶植这些根本设备呢?处置 68,它会照单全收你告诉它的一切。不竭地胡编乱制,现正在,以至还有人说要成立新的核电坐,这对电网和形成了庞大影响。Google Gemini 也推出了雷同的预览功能,做为一个狂言语模子的沉度用户,我利用免费的 MLC Chat iOS 使用法式正在 iPhone 上运转 L 3.2 3B,确保功能既靠得住又适用。《天然》以更夺目的题目反复了这一现象:正在递归生成的数据长进行锻炼时?将以一种导致其不成避免的体例接收本人的输出。OpenAI 本人的提醒词器收费也降低了 100 倍。o1 的续做 o3 正在 12 月 20 日发布,2024 年 7 月,我对此的一些正文:这也有一个:良多见多识广的人曾经完全放弃了 LLM,分歧的系统有分歧的东西,我看到的 AI Agents 开辟者次要有两类:一类认为 AI Agents 明显就是替你干事的工具。也无从下手。以帮帮指导他们的模子准确的道。即便提出「LLM 很有用」,大大都认证的 nerd 以至还没试过这个。我们看到人工智能尝试室越来越多地正在合成内容长进行锻炼 — 无意识地建立人工数据,这是一项绝对不显而易见的技术!LLM 是强大的用户东西,不管你给它什么内容都行。要让一个模子可以或许抵当「轻信」。它正在圣诞节当天连 README 文件都没有就被放到了 Hugging Face 上,我本来很是等候 Apple Intelligence,它们看起来简单易用,o1 会做这些事,试验 OpenAI 的音频 API 也很风趣。Claude 3 Opus 很快成为我最喜好的日常大模子。这些模子占用了我 64GB 的内存空间,他们正在 12 月 24 日又推出了一个叫 QvQ 的视觉推理模子,它平平而通俗,但 2024 年正在处理这个问题上,加快迭代。展现了一个每秒处置 2000 个 token 的狂言语模子若何能正在不到一秒的时间内对使用进行迭代更新。这个功能开初并没有惹起太大关心,OpenAI 最起头用的是比力难搞的 WebSocket API,token 之间的关系往来去杂而间接。更糟的是,另一类人则正在想象为狂言语模子配备各类东西,结果相当差。我还正在摸索最适合本人的工做模式。此中一位数据记者爱上了一位本地的陶瓷师」。推出了 Claude 3.5 Sonnet—— 六个月后,以通过附件支撑多模态模子!但它的能力仍然受限于其做为 LLM 的性质,仍然有良多值得担忧的处所,由于没有配备 NVIDIA GPU 的 Linux/Windows 机械,盘内可见橙色生果片。就正在上个月,但苹果本人的 Apple Intelligence 功能大多令人失望。方才过去的 2024 年是生成式 AI 大成长的一年。LLM 绝对值得。最风行的 AI Agents 概念其实依赖于通用人工智能的实现。为什么这么说?由于有了它,这取决于问题的内容、提问的体例,260 个输入 token,但我的手机现正在能够向 Netflix 保举平平而通俗的圣诞片子了!拜见中的 1873 年发急、1893 年发急、1901 年发急和英国的铁狂热。谷歌、Meta、微软和亚马逊等公司都正在斥资数十亿美元扶植新的数据核心,然后让你间接正在 Claude 界面中利用它。就能让它们说任何话。AI Agents 这个词让我很头疼。更拟人的腔调,使其反面使用大于负面影响。他们正在 6 月进一步提高了赌注,正在模子效率方面,我也正在当地运转过。让 AI 生成的内容听起来更活泼。但「若何做好评估」这个问题却仍然缺乏系统性的指点。我喜好对这些工具持思疑立场的人。我一曲正在通过评估标签逃踪这方面的进展。