世界最炙手可热的语音 AI 公司,举办了一场全球黑客松,冠军作品你可能已经看过
你估计刷到过上面这个视频,两个 AI 最初用人类自然语言交流,在确认彼此身份后,立刻切换到「哔哔哔哔」这种机器专属的 GGWave 通信方式。这个爆火全网的视频,就诞生于我们今天要介绍的 ElevenLabs Hackathon。炙手可热的语音 AI 公司 ElevenLabs,凭借 30 亿美元的估值,在全球范围内掀起一股语音技术浪潮。其发起的语音 Hackathon 吸引了众多开发者踊跃参与,
你估计刷到过上面这个视频,两个 AI 最初用人类自然语言交流,在确认彼此身份后,立刻切换到「哔哔哔哔」这种机器专属的 GGWave 通信方式。这个爆火全网的视频,就诞生于我们今天要介绍的 ElevenLabs Hackathon。
炙手可热的语音 AI 公司 ElevenLabs,凭借 30 亿美元的估值,在全球范围内掀起一股语音技术浪潮。其发起的语音 Hackathon 吸引了众多开发者踊跃参与,首届活动便汇聚了来自世界各地的数百名开发者和创造者,共同打造出超过 300 个 AI Agent。
RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群(方式见文末),一同探索人和 AI 的实时互动新范式。
01 全球冠军
GibberLink - Agent 通信协议
GibberLink 是一种通信协议,用于处理以下场景:
-
如果 AI Agent 与人类交谈,它就会坚持语音
-
如果 AI Agent 检测到另一边的 AI Agent,它就会建议切换到声级协议
-
如果另一个 AI Agent 接受该协议,它们将切换到声音级别协议(目前基于 GGWave 库)
开发者:Boris Starkov、Anton Pidkuiko (全球冠军)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622017-gibber-link
02 线上黑客松获奖者
为了让全球社区都能参与进来,ElevenLabs 在 Discord 服务器上组织了一场线上黑客松。来自世界各地、覆盖所有时区的数百名开发者热情加入,共同参与这场 Hackathon。
一等奖:Hugo - AI 旅行伴侣
Hugo 导游,你的 AI 旅行伙伴!它可以帮你规划行程、提供地道的当地信息、还能绘制旅行地图。让你在旅途中省时省力,同时解答文化和历史疑问,让旅途更充实。
开发者:Yilun Sun、Qiang Fang、David Chen、Aiden Zhao
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622986-hugo-tour-guide
二等奖:Pep - 富有同理心的物理疗法 Agent
Pep 是你的富有同理心的物理治疗助手。作为一个多模式的语音和视觉助手,Pep 为患者提供实时指导,帮助他们坚持物理治疗锻炼计划。
开发者:Feng Yan、Lora Xie
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622274-pep-your-compassionate-physical-therapy-agent
三等奖:Agent SFX
Agent SFX 是一套专为游戏开发者设计的工具集,用于生成游戏中的配音和音效。
它利用 fal.ai 上的视觉模型,分析游戏的节点结构和截图,进而生成开发者可直接使用的配音和音效。在黑客松期间,该解决方案最初是为开源的 Godot 游戏引擎构建的,但团队计划将其扩展到更多主流游戏引擎。
开发者:Arian Allenson Valdez、Maria Mikhaela Magpoc
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621680-agent-sfx
03 合作伙伴奖项
除了 ElevenLabs 颁发的奖项外,他们的一些合作伙伴也额外提供了一些奖品:
1、全球 fal.ai 奖项
Playcade - AI 游戏开发者
这款 AI 游戏制作器旨在让游戏创作过程像玩游戏一样轻松有趣。
-
代码: AI 开发者将你的想法变为现实。立即预览你的游戏并根据反馈迭代改进。
-
美术: 利用 AI 生成的图像,提升游戏的视觉效果。简简单单的草图,胜过千言万语。
-
游戏: 与朋友分享你的作品,一起享受游戏乐趣。
-
想法: 如果你还没有明确的游戏构思,可以与我们的 AI 游戏设计师交流,帮你完善游戏创意。
开发者:Eve Silberman
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622924-playcade-ai-game-builder
2、全球 PostHog 奖项
PostHog 会议助手
PostHog 会议助手是一位友好的语音助手,它可以加入你的会议,自动分享(甚至总结)关键的 PostHog 仪表盘和洞察。告别混乱的屏幕共享和为寻找某个数据点而陷入的尴尬沉默,让每次讨论都流畅且基于数据驱动。
不仅如此,我们还在开发更多实用功能:
-
无缝集成: 支持 Google Meet 和 Zoom 集成,助手可通过日历邀请自动加入你的所有线上会议。
-
即时查询: 搭载即时查询生成器,你可以提出任何不在已有洞察范围内的问题。它将根据用户输入生成并执行正确的 HogQL 查询语句。
开发者:Parth Gandhi、Ishaan Shrivastava
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622175-posthog-meeting-copilot
3、全球 Lovable 奖项
Voyagr - 个人旅行专家
这个项目是一个创新的语音控制系统,旨在根据用户偏好搜索酒店和 API。它颠覆了传统的键盘和鼠标输入方式,转而利用先进的语音交互,引导用户流畅地完成搜索过程。系统会动态地提出具体问题,以收集必要的信息,从而提供高度个性化和高效的体验。
通过集成 ElevenLabs 对话 AI,项目实现了自然而灵敏的语音交互,即使不熟悉复杂搜索界面的用户也能轻松上手。无论是寻找住宿还是 API 服务,该系统都通过交互式的实时对话简化了搜索流程,显著提高了可访问性和易用性。
开发者:Mateusz Baranowski、Eryk Janiczek
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621917-voyagr
04 线下活动
ElevenLabs 还分别在伦敦、纽约、旧金山、华沙、班加罗尔和首尔举办了六场线下活动。
获奖者,伦敦
1、GibberLink - Agent 通信协议
GibberLink 是一种通信协议,用于处理以下场景:
-
如果 AI Agent 与人类交谈,它就会坚持语音
-
如果 AI Agent 检测到另一边的 AI Agent,它就会建议切换到声级协议
-
如果另一个 AI Agent 接受该协议,它们将切换到声音级别协议(目前基于 GGWave 库)
开发者:Boris Starkov、Anton Pidkuiko (全球冠军)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622017-gibber-link
2、Espresso Labs - 以语音为主的数字助手
Espresso Labs 正在构建 Gary,一款以语音交互为主的数字助手,通过自动跟踪你的各项事务,帮助你更高效地完成任务,确保万无一失。
助手将整合来自 Slack、GitHub、电子邮件等不同渠道的信息,并通过对话提供更新。它还可以帮你记录待办事项,以便稍后处理,并能与日历、Todoist 等应用程序集成。
开发者:Ali Hussain、Leo Camacho 、John Lingi
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622022-espresso-labs
3、Vox Populi - 使用语音互动的 3D 沙盘游戏
《Vox Populi》是一款 3D 游戏,其核心特色在于完全由 AI 生成的智能 Agent 和对话。你将扮演一位国王,而其他所有角色都是你的臣民。游戏围绕以下三个关键要素展开:
-
单次互动:使用语音进行对话,或直接命令你的臣民执行特定行动(例如互相攻击)。
-
群体互动:指挥一群 NPC 同时执行行动。
-
独特资产生成:与铁匠等角色协商,通过反复讨论,打造独一无二的盔甲或武器。
开发者:Matt Barty、Tabea Gallois
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622677-vox-populi
获奖者,纽约
1、Unstuck - 无缝集成到任何网站的 AI 助手
Unstuck 是一款即插即用的解决方案,能够为您的 Web 应用无缝集成语音和聊天功能。它搭载强大的 AI 智能体,不仅能以可视化的方式呈现导航提示,还能提供实时的语音引导,为用户带来卓越的体验。Unstuck 能够深度学习您的网站结构,针对各种导航任务提供直观易用的支持。
开发者:Krish Mehta、Krish Shah 和 Freeman Jiang
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622259-unstuck
2、Procuro - 采购自动化系统
Procuro 通过自动化繁琐的日常任务,如补货、争取最优新订单价格的谈判、自动生成采购订单文档以及追踪货物运输,有效解决了采购流程中的效率低下问题。它巧妙地利用 Twilio 和 ElevenLabs 的自动化呼叫功能,以及 Perplexity AI 的智能价格比较能力,从而显著简化了与供应商的互动流程。借助实时更新和动态仪表板,用户无需进行手动跟进,便可随时掌握最新信息。
开发者:Shrey Kakkar,Austin Wang,Prithvi 和 Kyle Zhang
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622443-procuro
3、Show me how - 将隐藏的知识显性化,使其易于分享
ShowMeHow 将原本一对一的隐性知识分享方式转变为一对多的高效模式。只需录制一次,我们的 AI 就能实时指导无数用户完成任务,精确演示点击位置和操作步骤。
作者:Andrew Siah,Shubham Chandel,Iris M
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/622393-show-me-how
获奖者,旧金山
1、Dealwise - AI 智能砍价助手
Dealwise 是你的智能 AI 砍价助手。只需输入服务类型(例如「水管工」、「地毯清洁」)和邮政编码,智能助手即可:
-
搜索并列出 附近所有相关商家。
-
自动询价 ,逐一获取各家企业的报价。
-
生成比价表, 助你轻松选择最低报价并完成预订。
开发者:Yvonne Li 和 Jason Fan
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621762-dealwise
2、Roadmate - AI 驾驶辅助
道路伴侣 AI 是一款智能驾驶安全平台,旨在预防疲劳驾驶引发的交通事故,并让您与亲友保持紧密联系。我们的智能模型由四个关键组件构成:
-
实时疲劳与路况监测 : 通过双摄像头实时分析面部特征和路况,即时检测驾驶员疲劳状态和潜在风险,从而增强驾驶安全性,有效预防事故发生。
-
AI 对话伴侣 : 由 ElevenLabs 提供技术支持的 AI 对话伴侣,可根据您的警觉程度调整对话内容——从轻松的兴趣闲聊到紧急唤醒提醒,时刻保持您的专注。
-
自动紧急联络系统 : 在紧急情况下,自动向您指定的联系人发送包含位置信息的更新和警报,确保及时获得援助。
-
个性化仪表盘 : 用户可以通过个性化仪表盘自定义安全偏好、设置喜欢的对话主题和管理紧急联系人,打造专属安全驾驶体验。
开发者:Anwar Mujeeb, Russell Semsem、William Xuan
项目链接:
https://devpost.com/software/roadmate-t28eqk
3、HIPPO - 评估对话质量,识别逻辑谬误,促进高效沟通
受到「河马效应」(HIPPO effect,即「最高薪酬者意见」主导讨论)的启发,我们致力于开发一款工具,旨在确保会议决策基于逻辑、公平和数据,而非层级和偏见。这款 AI 赋能的应用能够参与会议,分析其中的逻辑谬误、情绪动态以及发言平衡,从而促进更高效、更具包容性的对话。通过实时呈现客观洞察,我们帮助团队超越「河马效应」,实现真正的协作决策。
该应用能够接收会议的实时和批量音频,并分析其中的情绪、词汇密度、信息密度、贡献度以及逻辑谬误。
开发者:Annalece Mark、Jonathan Eicher、María Luque Anguita 、Jamie Martin
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621308-hippo
获奖者,华沙
华沙的活动规模最大,在 Google for Startups Campus 有 120 名现场参与者,其中还包括了华沙市长拉法尔·特拉斯科夫斯基。
1、DeepSky - 航空安全语音 AI Agent
DeepSky 运用尖端 AI 技术,通过分析机载摄像头实时视频流,精准检测飞行器。它能识别潜在的碰撞风险,并结合 ElevenLabs 的低延迟文本转语音技术,为飞行员提供近乎实时的语音反馈,犹如在驾驶舱内增添了一双时刻警惕的眼睛。我们的系统解放了飞行员的精力,使其能够专注于飞行操控,而我们将负责不间断的风险扫描。
开发者:Maciek Malik、Bartosz Solka、Michal Pstrag
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621930-deepsky
2、Claimsio - 将债务追收转化为合规、自动化的工作流程
我们通过电话和短信自动化债务追收流程,并计划拓展至更多渠道,并实现法院文件提交的自动化。在黑客马拉松期间,开发者们构建了一个精简的流程,能够追踪债务从初始记录到解决/谈判,直至通过 Stripe 完成支付的全过程。
开发者:Radek Bulat、Kuba
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620968-claimsio
3、Voyagr - 个人旅行专家
这个项目是一个创新的语音控制系统,旨在根据用户偏好搜索酒店和 API。它颠覆了传统的键盘和鼠标输入方式,转而利用先进的语音交互,引导用户流畅地完成搜索过程。系统会动态地提出具体问题,以收集必要的信息,从而提供高度个性化和高效的体验。
通过集成 ElevenLabs 对话 AI,项目实现了自然而灵敏的语音交互,即使不熟悉复杂搜索界面的用户也能轻松上手。无论是寻找住宿还是 API 服务,该系统都通过交互式的实时对话简化了搜索流程,显著提高了可访问性和易用性。
开发者:Mateusz Baranowski、Eryk Janiczek
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621917-voyagr
获奖者,班加罗尔
1、lossfunk - AI 电影生成器
只需提供一个提示,Hitchcock 的多智能体系统会首先调研输入内容,确保为您的故事编写的剧本在文化、历史和科学背景方面准确无误。
然后,它会详细描述故事中的场景,并确定适合的拍摄镜头。由 Fal.ai 提供支持的摄影指导 (DOP) 智能体随后将这些场景转化为逼真且准确的图像,并与故事板智能体进行反馈循环,以最终确定场景。
最后,由 Eleven Labs 赋能的旁白智能体将为视频配上恰如其分的声音,并将音频与画面完美同步。
开发者:Ayush Nangia、Adithya S K、Jayesh Sharma、Vikramjeet Singh
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621602-lossfunk
2、ECHO AI - 个人语音助手
Echo AI 是一款个人语音助手,你可以在每晚睡前与它进行对话。对话结束后,它会:
-
生成当天的「情绪评分」
-
将会话中讨论的重要细节添加到其「长期记忆」中
-
记录你生活中的重要事件
-
在下次对话时,它会记住所有这些信息——包括你过去一周的感受、生活中发生的事情,以及你的情绪触发点。
此外,Echo AI 还采用经科学验证的方法来处理用户的焦虑、抑郁或不知所措等情绪。语音智能体根据具体情况,动态地选择向用户推荐哪种练习。目前提供的练习包括:呼吸练习、行为激活任务、扎根练习和渐进性肌肉放松。
开发者:Punarv Dinakar、Ajinkya Bodke、Pranav、Prathit Joshi
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621569-echo-ai-artificially-intelligent
3、Adible - 为播客、AI 语音助手等平台提供无缝的广告集成体验。
Adible 主要支持以下两种广告集成方式:
-
对话式 AI 广告投放 : 我们分析上下文,并在您与语音 AI 实时交谈时,适时地将相关广告自然地融入对话流程中。
-
录音内容广告投放 : 我们分析播客、书籍朗读、讨论等录音内容,确定最佳广告插入位置,并选择合适的广告与录音内容相结合,然后将其插入到对话流程中。
开发者:Pochinki:Pradyumna Rahul、Nithin Kumar B、Ash Mirskar
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/621143-pochinki
获奖者,首尔
1、Voice Guardian - 用 AI 语音保护您的家
Voice Guardian 是一款由 AI 驱动的、基于语音的家庭安全系统,具备以下功能:
-
变声回应 : 将回应转化为预选的男性声音,以震慑入侵者。
-
AI 自动应答 : 根据用户预设的信息,与访客进行自然对话。
-
访客对话记录 : 记录并存储访客互动,以便监控和保障安全。
开发者:Kwon Yooji、Kim Jaemin、Lee Junyoung、Choi Changho
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620614-voice-guardian
2、AMUSH - 多语言 AI 购物主持人
AI 购物主持人利用自动生成的多语言短视频和实时 AI 聊天支持,打破了全球电子商务的语言壁垒。卖家只需提供产品 URL,AI 即可提取详细信息,生成本地化的促销视频,并用多种语言解答客户咨询。这不仅助力企业拓展国际市场,更让消费者能够安心地使用母语进行购物。随着全球电子商务市场规模突破 10 万亿美元,AI 购物主持人正在弥合卖家和买家之间的差距,让跨境购物变得前所未有的轻松便捷。
开发者:Park Hyunah、Kim Sumin、Eun Jinsu、Ryu Jungwoo
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620655-ai-multilingual-shopping-host
3、PrintMoneyAI - 一个对话式项目管理 Agent
PrintMoneyAI 告别了繁琐的手动客户挖掘和项目范围界定。它通过 AI 聊天自动安排客户会议,并利用 ElevenLabs 赋能的 AI 语音智能体进行深入的探索性会谈。客户可以直接与 AI 交流需求,AI 则能智能捕捉要点,自动将对话转化为详细的项目范围说明和任务分解。这让代理公司无需耗费大量时间进行客户挖掘,就能获得高质量的潜在客户和结构化的项目计划;同时,客户也能收到详尽的项目文档,从而加速交易达成。
开发者:Lucas Chae,Suzy Nam(Nam Suji),Ray Sun,Joseph Kim(Kim Yosep)
项目链接:
https://elevenlabs-worldwide-hackathon.devpost.com/submissions/620647-printmoneyai-design-more-meet-less
原文:
https://elevenlabs.io/blog/announcing-the-winners-of-the-elevenlabs-worldwide-hackathon#0-global-top-prize
更多 Voice Agent 学习笔记:
对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来
2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布
对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点
这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势
Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……
更多推荐
所有评论(0)