DeepSeek美股交易收益9.68%碾压GPT:AI炒股实验完整解析
DeepSeek在美股交易中干翻了GPT们:一场没有剧本的AI炒股大战
最近看到一个挺有意思的实验——香港大学的团队搞了个项目叫「AI-Trader」,让几个顶级AI模型在美股市场上真刀真枪地对决。结果还挺意外的:DeepSeek以9.68%的收益率拿了第一,把GPT、Claude、Gemini这些大牌都甩在了后面。
这次实验到底怎么玩的?
说实话,这个实验的设计还挺硬核的。研究团队给五个AI模型——DeepSeek、GPT-5、Claude、Gemini和Qwen——每个发了1万美元,让它们在纳斯达克100成分股里自己折腾将近一个月。
关键是游戏规则特别狠:"三不原则"——不给交易策略、不许人工干预、不能作弊。也就是说,这些AI完全得靠自己的判断来决定买什么、卖什么、什么时候交易。
这跟我们平时看到的那些"AI炒股"可不一样。很多所谓的AI交易系统,其实背后都是程序员提前写好的规则,或者拿历史数据回测出来的"完美"策略。但这次实验里,AI真的是完全自主决策,没人管、没人教。
DeepSeek凭什么赢?
最终排名是这样的:
- 🥇 DeepSeek: +9.68%
- 🥈 Claude-3.7: +2.17%
- 🥉 GPT-5: +1.60%
- 基准QQQ指数: +1.22%
- Qwen3-max: -0.75%
- Gemini-2.5: -2.73%

DeepSeek的9.68%收益率相当惊人。要知道,这才一个月不到的时间。如果换算成年化收益,那就更夸张了。而且它的策略看起来也挺靠谱——主要买了NVDA(英伟达)、AAPL(苹果)、MSFT(微软)这些科技巨头,还做了分散投资和动态调仓。
说白了,DeepSeek玩的是"稳健投资"那一套:选优质标的、分散风险、根据市场变化调整。这跟很多散户一把梭哈某只股票的玩法完全不同。
Claude排第二,2.17%的收益虽然比DeepSeek差不少,但至少是正收益,而且策略比较稳健。GPT-5也勉强跑赢了大盘,1.60%虽然不多,但也算及格了。
Gemini到底怎么了?
最惨的是Google的Gemini,亏了2.73%。更夸张的是,它在短期内做了73次交易——这频率也太高了吧!
这其实说明了一个问题:频繁交易不等于高收益。Gemini可能是想通过高频操作来捕捉市场机会,但结果反而因为缺乏明确策略、频繁追涨杀跌而亏钱。每次交易都有成本(佣金、滑点),交易越多,成本越高。而且频繁交易很容易被短期波动牵着鼻子走,错失真正的趋势。
巴菲特那句话说得没错:"股市是把钱从急躁的人转移到有耐心的人手里的工具。"Gemini就是典型的"急躁型"选手。
阿里的Qwen也只做了22次交易,最后也是负收益。可能它太保守了,错过了一些机会。
这个项目已经开源了
好消息是,AI-Trader项目已经在GitHub上完全开源了,采用MIT协议。任何人都可以去下载代码,自己部署一套玩玩。
我看了下项目的功能,还挺完善的:
历史回测功能
你可以选择任意历史时间段,让AI在那个时间点"穿越"回去交易。系统会自动过滤掉未来信息,确保AI只能用当时能获取的数据做决策。这个设计挺科学的,避免了"事后诸葛亮"。
MCP工具链
项目用了一套标准化的工具系统,包括:
- 交易工具:买卖股票、管理仓位
- 价格工具:查询实时和历史价格
- 搜索工具:获取市场信息和新闻
- 数学工具:做金融计算和分析
AI通过调用这些工具来完成所有操作。

多市场扩展
虽然目前主要是纳斯达克100,但架构设计上支持扩展到其他市场。理论上可以改成A股、港股、甚至加密货币市场。
自定义AI代理
如果你会写代码,可以自己实现一个交易策略,然后让它跟这些大模型比一比。说不定你的策略能赢呢?
为什么金融市场是检验AI的好地方?
研究团队说,金融市场是检验AI智能水平的"终极试金石"。这话还真不夸张。
首先,市场充满了不确定性。 股价会受新闻、政策、情绪、国际局势等无数因素影响,这些因素之间还互相关联、互相影响。AI要想在这种环境下赚钱,必须有强大的信息处理能力和预测能力。
其次,市场有实时反馈。 你的每个决策都会立即反映在账户余额上。不像写代码或者写文章,可能要很久才知道效果。市场会马上告诉你:你这个决策是对还是错。
第三,市场是零和博弈。 你赚的钱,基本上就是别人亏的钱。这意味着AI不仅要理解市场规律,还要预测其他参与者(包括其他AI)会怎么做,然后在博弈中找到最优策略。
最后,市场有"反身性"。 AI的交易行为本身会影响市场价格,进而改变未来的市场状态。这就需要AI能够思考"如果我这样做,会对市场产生什么影响?其他人会怎么反应?"这种多层次的推理。
几点思考
1. 中国AI已经在某些方面超越了
DeepSeek作为一个中国的开源模型,在这个实验里击败了OpenAI、Google、Anthropic这些硅谷巨头的闭源模型。这说明在特定任务上,中国AI技术已经不输甚至超过了美国同行。
当然,这只是一个实验,不能说明全部问题。但至少证明了:技术路线和算法设计,有时候比砸钱更重要。
2. 基准测试不能说明一切
很多AI模型在学术榜单上分数很高,但一到实际应用就拉胯。金融交易这种真金白银的场景,才是真正的试金石。
以后评价一个模型好不好,可能不能只看它在MMLU、HumanEval这些测试上的分数,还得看它在真实场景里的表现。
3. AI投资还不能完全替代人类
虽然DeepSeek表现不错,但也要清醒地认识到:一个月的实验时间还是太短了。股市里有句话叫"牛市里傻子都能赚钱"。如果遇到熊市、震荡市、黑天鹅事件,AI还能不能稳定盈利,这还需要更长时间的验证。
而且,AI目前还缺乏对宏观经济、政策变化、突发事件的深度理解。这些"软"信息往往需要人的经验和判断。
所以我觉得,未来更可能是"人机协作"的模式:AI负责处理海量数据、发现规律、执行交易,人类负责战略决策、风险控制、应对黑天鹅。
4. 普通人能用吗?
理论上,AI-Trader已经开源了,你可以下载下来自己玩。但实际操作起来还是有门槛的:
- 需要懂点编程知识
- 需要申请各种API密钥(OpenAI、Alpha Vantage、Jina AI等)
- 需要一定的股票投资知识
- 最重要的是:即使AI能赚钱,也不保证你能赚钱
投资有风险,入市需谨慎。 这话永远不过时。
最后想说的
这个实验最有意思的地方,不是DeepSeek赢了,而是让我们看到:AI已经可以在复杂的金融市场中自主决策并获得正收益了。这在几年前还是不可想象的事。
但同时也要警惕:如果越来越多的AI参与市场交易,会不会导致市场行为趋同?会不会引发新的系统性风险?这些都是需要思考的问题。
对普通投资者来说,AI工具可以作为辅助,但不能完全依赖。最终还是要建立自己的投资理念、控制好风险、做好心理准备。
毕竟,市场永远不缺新技术、新概念,但赚钱的永远是那些保持理性、坚持原则的人。
项目地址: https://github.com/HKUDS/AI-Trader
许可协议: MIT License