生生不息的创造力
今年上半年,由于住的地方离公司比较近(步行 5 分钟),
下班后我的个人时间比较充裕,所以简单做了几个小项目。
- 我的个人网站
年初主要精力放在我的个人网站上:https://del.wang
首页上浮的石头寓意打破常规的创造力,不随波逐流。
- 飞鱼,一个极简的跨平台视频播放器
比起在一些布满广告的盗版网站上看视频,我更喜欢在自己的网站上追剧。
- MiGPT,将小爱音箱接入 ChatGPT
年初做的一个小玩意,后面还意外登上了 Github Trending。
- MagicMirror,一键 AI 换脸
12 月份参加公司举办的 AI Hackathon 时做的一个小工具,换脸从未如此简单。
- Q-Prophet,币安量化交易
我的财务自由之路的一部分。假如每天连续盈利 10%,3 个月即可实现财务自由。
做这些项目的驱动力,
- 也许是为了满足自己的个人需求
- 也许是为了打发周末无聊的时间
- 也许是为了完成一件作品时的快感
- ……
Whatever,我创造,故我在。
Enjoy! ;)
爆发的前夜
不得不承认 2022 年 ChatGPT 的诞生,是历史性的转折点。
2023 年,人们开始认清并投身到这股时代变革的潮流中,大家站在同一起跑线上。
那是一个混沌、开荒的年代,大家在有限的上下文窗口长度里,尝试各种可能性。
LangChian、AutoGPT、OpenInterprter、ReACT、Function Call、RAG……
大家脑洞大开,想要榨干 LLM 的所有潜力。
这一年,我的年度未来关键词是 AI、具身智能和比特币。
2024 年,则是 AI 在各行各业百花齐放的时代。
一夜之间仿佛所有的产品都推出了 AI 模式。
人们一开始觉得什么都值得用 AI 重做一遍,
可是后来发现 AI 和想象中的还有很大差距,
逐渐认清 AI 的局限,开始变得务实,追求现实收益,
市场变得更冷静和理智了,竞争也变得越来越激烈。
不过不必悲观,行情正在加速好转。
今年,我看到了 AI 在不同领域的飞速进步,比如:
- Suno 生成优美动听的音乐
- 开源 Flux 模型逼真的生图效果
- Cursor 编写高质量的代码,实现精美界面
- GPT-SoVITS、F5-TTS 等自然逼真的语音合成效果
- Sora、可灵等视频大模型生成各种充满想象力的视频
- ……
还有一些 AI 硬件上的进步:
- 具身智能:宇树、Tesla Optimus 等机器人加速发展
- 头显:Meta Quest3、Apple Vision Pro
- 耳机:字节豆包 Ola Friend 耳机
- 眼镜:Meta Orion,下一代增强现实眼镜
- 各种语音助手、桌面宠物、AI 玩具等
- ……
虽然一路磕磕绊绊,但我隐约感觉,
现在的技术发展,已经来到了某种临界点。
爆发的前夜。
毋庸置疑,在接下来的日子里,
AI 将以更加快速、深入的方式,
颠覆人们的衣食住行和各行各业。
Everything! Everywhere! Everyone!
在接下来的一年,AI 将会淘汰更多的岗位:
- 自动驾驶:百度萝卜快跑
- 翻译/家教:ChatGPT 推出音视频通话模式
- 影视:AI 参与编剧、分镜、特效视频生成
- 游戏:AI 制作 2D/3D 游戏资产,生成游戏内容
- 医疗:AI 辅助诊断病人影像资料,辅助问诊开药
- 营销:AI 生成营销文案、宣传物料、自动回复评论
- ……
最后,今年我的年度未来关键词是:
- AI 硬件:扩展 AI 的各种视野和能力
- 多模态:听说读写看,全知全能的个人助理
- 工作流:提升各行各业的效率和质量(尤其是设计领域)
还有 AI 教育和医疗,此处就不过多展开了。
再补充一个我观察到的现象:
早期看好的一些 AI 赛道,基本上会被瞬间涌入大量竞争者,
前期觉得绝妙的想法和产品,后面可能会变得一文不值甚至落伍。
这说明两件事情:
- 精雕细琢的长期模式,在 AI 时代似乎并非明智之选。
- 只看到眼前的一步就动身是危险的,向后一步便可能是万丈深渊。
为趋势买单,而不是刻舟求剑。