标签 应用 下的文章

ChatGPT后,我的高频实用产品

ChatGPT火了之后,已经有非常多的第三方服务在用它的API开发新的产品,而且相比最开始的尝鲜性质,越来越多的产品都在实用性上走得很远了,我自己这几天都沉迷于用它们重新构建工具库。

说几个目前来看我用得非常高频的产品吧:

- ChatPDF(chatpdf.com)

上传PDF文件然后通过问答形式让它帮你检索信息,相当于AI帮你读完了整个PDF文件,你想知道什么直接问它就行,中英文都能支持。

目前的免费版最大可传200页的PDF,超过了就要用自己的OpenAI API了。

平替版有Humata(humata.ai),功能相同,页数上限是60,2款同时用可以交叉对比,避免错漏。

- ChatExcel(chatexcel.com)

北大团队做的,和上面相似,只不过上传的是Excel,然后可以通过自然语言下命令,对表格进行任意调整,调用的是OpenAI专为表格处理做的API服务OpenAI Tabulate。

美中不足的是这还只是一个demo,只支持1MB以内、不超过10列的excel文件,也没有收费选项,局限性很大。

- bilingual_book_maker(GitHub)

简单粗暴的全书翻译,需要部署到本地,直接把epub文件放进去跑,需要消耗自己的token,成本大概在1万字/0.15美元左右,出来后就成了一本双语书。

因为算力需求过大,一般耗时会比较长,可选GPT-3和ChatGPT两种模型,翻译质量都很不错,有人做了网页套壳版(goldengrape-bilingual-book-maker-streamlit-app-x7nhof.streamlit.app),可以在线使用。

- Eightify(eightify.app)

Chrome浏览器插件,给YouTube视频生成带有时间戳的摘要,适合对话/访谈/演讲类的视频,基于文本识别和热度判断来帮你划重点,免费版每周只5个额度,超出需要付费。

平替版的还有Glarity(glarity.app),不但支持YouTube,还支持Google和Yahoo,但是总结得会更简略一些。

面向Bilibili的同类服务有BilibiliSummary(GitHub)和BibiGPT(b.jimmylv.cn),但是稳定性都不太好。

- Mem(mem.ai)

OpenAI领投的知识库工具,比Notion要轻,把它当成一个每日信息摄入的保存盒子,扔进来之后由AI咀嚼整理,生成新的简报给我。

Notion AI当然更强大一些,但是Notion更适合再往后一步的沉淀,在收进Notion之前我需要中转站来做进一步的精简处理。

- HARPA(harpa.ai)

Chrome浏览器插件,除了随时调用ChatGPT来对当前页面进行总结之外,还整合进去了很多自动化功能,比如你可以让它跟踪一家网店的商品价格,降价到了你设置的数字之后之后第一时间通知你。

因为功能种类很多,所以用起来可能会繁琐一些,前期需要不断的调教,或者干脆放弃多余的选项,只用它的页面感知能力,超乎想像的全能。

- AI Dungeon(play.aidungeon.io)

MUD地牢游戏,可以无限生成龙与地下城式的游戏内容,很适合消遣和猎奇,用的好像是GPT-3模型,对中文的支持度非常高,对话起来你说中文它出英文完全没有任何障碍。

这完全脱离了RPG游戏的任务线,你可以天马行空的推进剧情,最后通关或者失败,好的剧本会被分享出来让其他用户进去重开游戏,然后又产生新的支线。

我玩了一个多星期了,感觉略微看到了游戏产业在未来的一种可能性。

* * *

从外网的情况来看,现在每天都有几十个基于OpenAI的新产品上线,互联网行业很久没有出现如此让人兴奋的画面了。

这里面有些是套壳应用,就是针对一个具体需求写了前端,比如用户输入需求然后它给你推荐3本书这种,只是对ChatGPT能力做了简单的连接,价值有限。

稍微复杂一点的,我看到有专门服务于特定场景,比如很多人用Tinder搭讪妹子不知道怎么聊天,然后它可以提供500多种开场白,一步一步帮你跟妹子聊天。

最受欢迎的市场在企业端,因为付费意愿最高,所以大量的产品都是文案生成、话术优化、客服对接这些,也有游戏开发者分享了一套完整流程,从用ChatGPT提出要求,到Midjourney绘制素材,最后存入Figma,丝滑得不可思议。

更多让人觉得牛逼的想法都还在测试,比如想用LLM模型来给金融市场做定向量化分析的,让零基础的用户直接就能下指令编写程序的,给AI喂完古往今来所有学术论文然后让它成为大学专用搜索引擎的,每一个都对未来影响深远。

最可怕的是,OpenAI和它的ChatGPT,也只是这波AIGC浪潮里的浪花之一而已,而AIGC又是整个AI生态里的一条支流,总感觉在我们的有生之年,还有机会经历一场从工业到生活的彻底改变。

自制App追踪全美麦当劳的“冰激凌机”

试想一下,当你兴致勃勃的开车去买麦当劳的冰激凌时,到了店里发现冰激凌机坏了,这是多么痛的领悟……

在国内,我们可能觉得这是小概率事件,但Rashiq Zahid 可不这么认为。

Rashiq Zahid 是一位德国的软件工程师,今年24岁了。他就经常遇到这种倒霉事,很多次他特意开着车去买麦旋风或者奶昔的时候,却听到来自店员的那毁灭性的话语,‌‌“冰激凌机坏了‌‌”。

于是,Rashiq 决定专门为麦当劳的冰激凌机做一个App,机器坏没坏在去之前就可以一目了然,再也不用担心跑冤枉路了。

他把做好的应用公布在了自己的推特上,瞬间引来了大家的关注,已经有3.5w人为他点赞了。

网友也纷纷称赞他的创意,看来大家都很需要这个App~甚至有网友愤愤不平,‌‌“我从来不相信机器会坏掉,我认为他们提前关掉了机器,这样他们就不用在关门前一小时或半小时清洗机器了。‌‌”

来看看Rashiq是怎么建立这个应用的吧~

灵感来自麦当劳App,对其API进行逆向工程得到‌‌“McBroken‌”

今年7月,Rashiq去了柏林克罗伊茨贝格区的一家麦当劳,他想在现场的自助下单机器上点一份麦当劳的新地(Sundae),但却无法供应,他试图通过App下单,同样遭到了挫败。

在看他来,这趟简直是白来了。‌‌“我想,一定有什么可以做的,‌‌”Rashiq说道。

于是他就想到创建一个名为‌‌“McBroken‌‌”的App。

Zahid 准备从麦当劳可以在线点单的App入手,因为一旦冰激凌机坏掉,App上就会显示无法供应。

‌‌“我喜欢浏览不同的应用程序,看看它们的安全特性和内部API。我非常熟悉如何对应用程序进行反向工程。这应该很简单。‌‌”

结果这比他想象的要难的多。

最初,他创建了一个API,试图每隔一分钟就从每一个麦当劳的位置添加一个新地到他的购物车中。然而这款应用弄清了他的意图,并屏蔽了他——‌‌“就好像,你不能这么做,你看起来像个机器人,‌”他回忆说。

经过一夜的反复试验,Zahid想出了一种特殊的时间框架。后来,他的程序尝试每30分钟添加一个冰激凌。如果机器人能够成功添加到购物车,它就会让McBroken知道该位置的机器正在工作。如果不能,位置就会得到一个红点。

一位自称是麦当劳员工的推特用户亲测有效。

Zahid直呼,‌‌“我现在每分钟都在美国的各家麦当劳下单一个价值18752美元的订单,来弄清楚哪些地方有坏掉的冰激凌机。‌‌”

Zahid首先在德国测试了McBroken,该公司有大约1500家分店。他骑车到柏林的每一个地方,手动输入新地(Sundae),来确定他的机器人是否返回了正确的信息。结果证明,他成功了!

如今,他把这个App扩展到了美国。

在这里可以显示所有美国麦当劳分店的地图,用点来表示。正常工作的冰激凌机用绿点表示,而坏掉的用红点来表示。在App右侧还可以看到汇集的统计数据,比如当前美国的麦当劳有7.54%的冰淇淋机坏掉了,其中纽约坏掉的冰激凌机已达15.22%

Zahid称,‌‌“我当时想,这对德国来说会很有趣,但对美国来说可能会很不可思议,美国可是麦当劳的总部。‌‌”

20分钟内一万名访问者,网站曾临近崩溃,如今受到了麦当劳高管支持

在网站推出的20分钟内,McBroken就获得了1万名访问者。然后网站就开始运行缓慢,最终崩溃了。

‌‌“我在一个每月5美元的服务器上运行这个程序,所以它肯定会崩溃,‌‌”Zahid说。经过一个小时的故障排除(包括卸载一些流量),Zahid 向the Verge的记者保证,网站‌‌“工作得很完美‌‌”。

他原本就是以做着玩的心态建立的应用,当他听说人们发现它确实有用时,他感到很震惊。‌‌“我做这个只是为了好玩,‌‌”Zahid说。但却被网友称为,‌‌“哇,这是我这周看到的最好的东西。‌‌”

随着网站的影响力与日俱增,不知道麦当劳最终是否会关闭这项业务,但麦当劳美国通信副总裁David Tovar似乎表示支持。他在推特上称,‌‌“只有真正的麦当劳粉丝才会竭尽全力帮助顾客买到我们美味的冰激凌!‌‌”

输入讯息(图片来源:maxpixel/公有领域CC0)

(博谈网记者郑典编译报道)据《Engadget》2018年12月18日(周二)报道:Gboard supports 500 languages just two years after launch

推出仅仅两年后,谷歌(Google)的Gboard虚拟键盘在Android上支持500种语言。据谷歌称,这使得全球约90%的人口能够用他们的第一语言通过手机进行通信。

总而言之,Gboard支持40多种书写系统,从多种语言中使用的脚本(如罗马,西里尔和梵文)到Ol Chiki之类的,后者只用于Santali。为了帮助人们更自然地进行通信,针对每种语言变体调整了键盘布局,自动更正和预测文本功能也是如此。

谷歌于2016年12月推出了Gboard,支持100种语言,并且在过去几个月中添加了许多。在相对较短的时间内达到500种是一个值得注意的里程碑,特别是因为添加语言意味着谷歌通常需要找到足够的书面文本来训练AI。这对于英语或法语来说足够简单,但对于不太常见的语言来说更难,尤其是那些比书面语言更具语言性的语言。

为了获得足够的数据来添加语言,谷歌通常会与母语人士分享写作提示,以创建文本数据库。一旦它制作了键盘布局并训练了人工智能,谷歌就会要求母语人士测试语言种类并提供反馈。