标签 科技 下的文章

AI 会不会取代医生

关于 AI 会不会取代医生的话题。

去年网上有一个帖子传得比较多,关于未来几年内人工智能会取代医生的,还说首当其冲的就是影像科医生。以下是我去年写过的内容。

这个问题要是展开说的话很复杂,只往简单里说。

1. 先说传说中「最可能被取代的影像科」。

这几年影像科比较大的改变就是引入了 AI。我去年在一篇文章里提到,现在很多肺结节并不是医生发现的,而是 AI 发现的。现在健康人群体检,最高有 50% 的概率能发现肺结节,也就是说两个人就有一个会发现。

因此:

- 现在高清晰的 CT 扫描以及 AI 技术的引入,使得肺结节的检出率显著提高;

- 但肺结节的高检出率在临床上有什么样的收益和风险,我们目前还不清楚。

再比如说甲状腺超声这二十年也很普及,发现的甲状腺结节也特别多,但是后来发现很大一部分甲状腺癌病例与过度诊断有关(尤其是女性)。为了解决这个问题,卫健委还在去年的诊疗指南里面强调,不推荐一般人群行甲状腺肿瘤筛查。

所以 AI 能代替的是一些反复的工作,AI 有更高概率发现影像学异常,而且随着技术发展,它的准确率会越来越高,并且 AI 不会疲劳。

但是准确度高并不直接等价于有临床意义,这需要更多更长时间的临床研究才能有答案,这需要大量医生去思考、设计、开展并归纳总结的系统问题。

2. 另外一方面,看片子并不是影像科医生的全部工作。

- 某位患者应当选择什么样的影像检查(比如一个乳腺癌患者应当做钼靶、B 超、MRI 还是 PET-CT)

- 如何基于影像学检查结果给于临床医生可靠的解读;

- 如何参与到临床实践当中(比如影像引导下的介入治疗);

……

看片子只是其中的一个基础操作而已。况且,在以前各种仪器检查中就多多少少有机器辅助解读了,比如十几年前我在医院实习轮转的时候,那时的心电图机就能直接给出诊断结果了,当然结果不一定准确,还需要医生最终确认签字。

还有一个问题就是,我们训练 AI 的数据来自于以往的影像检查结果,但是医学领域不像互联网的公开数据,它存在很大的信息获取屏障,基于患者隐私保护也好、或者不同厂家、医院设置的行业壁垒,这些都是阻碍影像 AI 训练的地方。

当然假以时日,这些问题我认为都可以解决,不过至少在现在,AI 的影像解读结果还达不到普遍认可的地步。

3. 这也涉及到更深层次的问题,那就是行业和法律许可问题。

客观的说,一个低年资、经验有限的影像科医生,和现在训练有素的影像 AI 模型,我想后者的解读准确率肯定更高一点。但问题在于,我们现在所有行业所认可的,是「人类」的解读结果。

比如保险公司和法庭是否愿意采纳 AI 给出的疾病判定,一方面是 AI 无法承担责任,另外一方面医生基于自身的利益考虑也会「让 AI 无法担责」。归根到底,这个世界的游戏规则是人类设定的,人类首先会保护自身的利益。

这就是医学以外的限制,打破这些限制的难度远高于 AI 算法的改进。

4. 医生会被替代这种说法,并不是 AI 时代才有的,有电脑的时候就有这种说法了。包括在十年前 IBM 的 Watson Health 也曾被寄予厚望,而且 Watson 一上来就是诊疗难度最大的癌症领域,IBM 也投入了数十亿美元,也与美国最顶尖的 MD 安德森癌症中心、纪念斯隆凯特琳癌症中心展开 Watson 的合作。

但是 Watson 最终失败了,它最终没有被训练成一位癌症专家。这背后的原因有很多,大家感兴趣的可以去查一下,或者你可以直接问下 ChatGPT 为什么 Watson 没有达到它最初的设计目标。

还是上面那句话,假以时日,我觉得医生会有越来越强大的 AI 工具可以协助诊疗,但并不是替代医生。重复机械的操作会被取代,而且应该被取代,注意这里说的是「操作」而不是「职业」。

再往前一点说,上世纪四五十年代,北京协和医院的血常规是医生在显微镜底下一个一个去数血细胞的,现在机器直接分析结果了,不需要耗费大量的人力工作了,但协和仍然还是协和。

5. 对于任何一个职业而言,能提供完整解决方案的职业被取代的难度是最大的。

影像报告分析不难,但是目前只有医生给出完整的、有临床意义的解决方案。在任何一个时代,请多多尝试学习使用新工具,而不是与工具为敌。

这一点并不仅仅是限于影像医生一个职业,也包括医疗行业以外的其他职业。

最后,我在之前写肺结节 AI 的那篇文章里提到,将来我们应该相信医生,还是相信 AI?

其实,这两者并不是对立关系的。AI 可以辅助医生提高工作效率,而医生也应当将技术本身转化为患者的临床获益。

医学进步,以人为本。

年赚 240 万:全世界最成功的独立开发者

介绍一位独立开发者:Pieter Levels,他应该是独立开发者这个圈子里的顶流了。Pieter Levels 在 Twitter 上比较出名,有将近 50 万的关注,在简介中,他直接写着自己几款独立开发产品的收入情况。

我简单算了下,他现在每月的收入已经达到 19 万美元,这些爆款产品包括远程工作网站 Remote. 数字游民宜居地网站 Nomad List.AI 摄影师 Photo AI 和 AI 室内设计 Interior AI。

Pieter Levels 是一位自学成才的开发者和创业者,他一个人完成产品的设计、开发和运营。因为工作比较自由,所以他这些年也过着数字游民的生活,曾在 40 多个国家和 150 多个城市生活过。让人羡慕。

昨天早上到公司,我惊喜地发现美国知名的播客主理人 Lex Fridman 发布了一期和 Pieter Levels 对话的视频,时长 3 小时 40 分。下午,我花了 4 个多小时,细嚼慢咽地看完了这期内容。今天写个总结和感触,希望对你有所启发。

1. 想做独立开发者,怎么发现产品点子?日常生活中,你可以琢磨哪些事情让自己烦恼,哪些产品构建得不好。之前你可能走马观花地没想过这些问题,但如果你想做独立开发,想构建自己的产品,那就要处处观察和留心。你要去琢磨哪些问题可以通过构建一个产品来解决,然后把想法列出来,并筛选哪一个是靠谱的。

2. 独立开发适合那些自我驱动力很强的人。他们不需要别人推动,他们自己会主动去做。即使遇到问题,他们也能够自学,并解决问题,而不是卡在那里等靠要。那些总是靠别人推动的人,那还是去公司工作比较好。

3. 开发产品的过程中,要让自己专注于问题本身,听从自己的直觉判断。记得,别不停地问问问,你只有在遇到具体问题时才咨询别人,并且你咨询他们不是为了把问题推给他们,而是为了从他们的角度获得智慧。即使他们的观点最终是你不同意的,你也会从中获得智慧。

4. 当开始构建产品时,很多工程师会习惯性地考虑技术问题,纠结不重要的小问题。他们总是控制不住地想使用更新、更好的技术。但其实,技术栈并不是最重要的。重要的是,要确认自己想做的产品人们愿意为之付费。Pieter Levels 的技术栈是 HTML.jQuery.PHP 和 SQLite,够老够弱吧。

5. 独立开发者很少能够拿到融资,他必须得一个人搞定所有的事情。这就反过来要求开发者必须速战速决,Pieter Levels 常用的策略是以两周时间为单位,快速验证某个需求是否有人买单。有则继续,没有则放弃。总之,验证的速度要快,也要舍得放弃。

6. 说到做独立开发,其实很多人的主要卡点还是行动。大家问来问去,左思谋,右犹豫,但却未曾走出重要的一步。这和小马过河的道理一样,自己适不适合,以及有没有机会,下去试试才能知道。并且机会很多时候也是迭代出来的,不会一蹴而就。行动永远是最重要的。

7. Pieter Levels 说,比如他想做一个播客,他不会问 Lex 如何成为成功的播客主持人这种问题。他会直接开始做,找对标,复制他的方法。先模仿,然后逐步加入自己的特色。这就是创造过程,在前人的基础上进行创造。

8. 具体构建产品时,要注意分清楚哪些是主要因素,哪些是次要因素。以做播客为例,很多人花钱购买昂贵的录音设备,调整录音环境,他们在这上面花了很多心思。但其实,播客最重要的是内容,特别是在早期 MVP 阶段,应该把注意力集中在最重要的事情上。

9. 千万不要有完美主义倾向。完美主义倾向很可能会在无意中给自己制造很多困难,比如你觉得做播客就得买一个很好的设备,也就是说你得先投入一笔钱进去。但这没必要,声音只要清晰就可以了,有的人还可以用 iPhone 拍出来电影呢,他也没用专业的摄像机。快速开始,快速行动,逐步完美。

10. 独立开发者最好的做法是一开始就收费。向用户展示产品,并在着陆页上说明你在做什么。如果用户想使用它,就得付钱。作为独立开发者,你没有融资,你没办法像很多初创公司那样先为用户提供免费服务,然后再在某个时机进行付费转化。你没有那么多时间和精力,并且直接收费,这也能验证产品是否命中刚需。

11. Pieter Levels 做过最出名的产品当属 Photo AI,一款利用 AI 技术来生成人像照片的产品。这款产品一个月就能帮 Pieter Levels 挣到 6.7 万美元。Stable Diffusion 刚发布时,他就开始玩,当然,他的玩不是走马观花地玩,而是边玩边思考利用这项新技术可以做点什么。

12. 当时,Pieter Levels 感觉 Stable Diffusion 不适合生成人物照片,但在建筑图片生成方面却很惊艳。于是,他迅速先做了一个产品 thishousedoesnotexist.org,点一下,就能生成一个房子。用户可以对房子进行投票,系统来统计哪个房子最受欢迎。不过,这产品没生命力,用户留存不好。

13. 在这个失败产品的基础上,Pieter Levels 进一步迭代,把产品方向调整为室内设计:Interior AI,用户上传一张自己房间的照片,AI 来进行设计。Interior AI 推出后获得了成功,到现在两年过去了,每个月都能有 4 万美元的收入。

14. 为了优化 Interior AI 室内设计的生成效果,Pieter Levels 开始学习微调。在这个过程中,Stable Diffusion 也在发展,他发现 AI 已经可以基于自己的照片生成不同风格不同场景的人物照片,于是,他受此启发,开始构建 Photo AI。我查了下,那时 ChatGPT 还没发布。

15. Pieter Levels 并不是什么技术大牛,现在构建产品,他用到的技术还是 jQuery 和 PHP,他不会刻意追求新技术,他讲究简单和实用主义。但注意,他不是故步自封,不爱学习,你看 Stable Diffusion 在那么早的时候他就已经尝试了。他学习新技术的目的一定是为了构建产品。

16. 至于学习,Pieter Levels 认为行动永远是最好的方法。比如想构建一个网站,那就问 ChatGPT,怎么制作网站,然后一步步的,遇到问题解决问题,在解决问题的过程中去学习,而不是先买两本书,或者三门课,看完之后才动手干。边干边学,边学边干。

17. Pieter Levels 曾经做过七十多个项目,但最后只有四个赚钱。这么算,成功率也就 5%。5%,这个很低的数据也告诉想创业、做副业的人,别幻想一举成名天下知,做好十年寒窗无人问的心理准备。

18. 很多人的发展路径是自己赚钱后,就会招聘更多人来一起做事情,比如做市场,或者社区运营。Pieter Levels 的策略是永不招人,这会倒逼他不断自动化手头的工作。他创造了非常多的产品,每款产品做完之后,都可以在不需要人的情况下运转、赚钱。

19. 对于压力,Pieter Levels 的看法是,大多时候,压力来自于控制欲。你需要放手,让它自由发展,因为你无法控制任何事情啊。如果你内心拧巴的时候,试着觉察下,自己是不是想控制什么很难控制之事。别有控制的执念。

20. 很多人都会幻想自由职业之后的散漫生活,睡到自然醒,再也没有工作压力,没有领导的 KPI,想去哪里去哪里。但 Pieter Levels 认为,限制才会让人快乐。他一直处在创造新产品的状态中,他认为创造性表达是一项有意义的工作,每天都有挑战,每天都试图解决一些问题,这非常有趣。

谷歌 CEO的自我放飞

有点好笑,曾经担任谷歌 CEO 长达 10 年之久的 Eric Schmidt 前几天去斯坦福大学受邀计算机学院的会议,他的演讲全程各种放飞自我,中途语重心长的告诉台下学生,这场会议是保密的,自己说的那些话千万不要外传。

然而,主办方对 Eric Schmidt 说,这场会议有摄像头正在全程直播…… 他的表情就凝固了。虽然斯坦福大学后来把视频从 YouTube 撤了下去,但已经有很多人都做了存档,Github 上也有全文备份:transcripts/Stanford_ECON295⧸CS323_I_2024_I_The_Age_of_AI,_Eric_Schmidt.txt

照例给大家划划重点:

– 现在的谷歌为什么在 AI 领域输得一塌糊涂?因为谷歌觉得让员工尽早回家和平衡工作比赢得竞争更加重要。如果你的员工每个星期只来公司上一天班,你怎么可能比得过 OpenAI 或是 Anthropic?

– 看看马斯克,看看台积电,这些公司之所以成功,就是因为能够卷员工,你必须要把员工逼得够紧才能获胜,台积电会让物理学博士第一年下工厂干活,你们能想象美国的博士生去流水线吗?

– 自己犯过很多错误,比如曾经觉得英伟达的 CUDA 是很蠢的编程语言,但现在 CUDA 是英伟达最牛逼的护城河,所有的大模型都要在 CUDA 上运行,而只有英伟达的 GPU 支持 CUDA,这是其他芯片撼动不了的组合。

– 还有微软跟 OpenAI 合作时自己也觉得难以置信,微软怎么能把最重要的 AI 业务外包给那种小公司啊,结果再次看走了眼,再瞧瞧苹果在 AI 上的温吞,大公司真的都官僚化了,奋斗逼都在创业。

– TikTok 给美国人上了一课,在座各位年轻人以后如果创业,能偷音乐什么的就赶紧去做 —— 似乎是在黑 TikTok 早期纵容盗版 BMG—— 如果你做成了,就有钱雇佣最顶级的律师帮你擦屁股,如果你没做成,那就没人会起诉你。

– OpenAI 的星际之门在宣传时说需要 1000 亿美金,实际上可能 3000 亿都打不住,能源缺口太大了,给白宫提过建议,美国以后要么跟加拿大打好关系,水电资源丰富,劳动力便宜,而且够近,要么去和阿拉伯国家套近乎,让他们来做主权投资。

– 欧洲已经没戏了,布鲁塞尔(欧盟总部所在地)一直都在摧毁科技创新的机会,可能法国还有点希望,德国不行,其他欧洲国家就更不用提了,印度是美国盟友里最重要的摇摆州,以及美国已经失去了中国。

– 开源很好,谷歌历史上的大部分基础设施也都受益于开源,但是说实话,AI 行业的成本太高了,开源负担不起,自己投资的法国大模型 Mistral 将会转为闭源路线了,不是所有公司都愿意且有能力像 Meta 一样当冤大头。

– AI 会让富者愈富、穷人恒穷,国家也是,这是一场强国之间的游戏,没有技术资源的国家需要拿到加入强国供应链的门票,否则也将错过盛宴。

– AI 芯片属于高端制造业,产值很高,但不太可能拉动就业,你们可能没几个人去过芯片制造厂,里面全是机械化生产,不需要人,人又笨又脏,所以不要指望制造业复兴,苹果把 MacBook 的产线迁回德州不是因为德州工资低,因为根本不用再大规模雇人了。

– 历史上,电力在引入工厂之后并不比蒸汽机创造了更多的生产力,是过了大概 30 年左右,分布式电源改造了车间布局,推动组装系统的出现,再才开始了生产力的飞跃。现在的 AI 和当初的电力一样,有价值,但还需要组织创新,才能真正拿到巨大的回报,目前大家都还只是在摘取「低垂的果实」。

Midjourney 在旅途中你看到了什么风景

为什么一个只有11人的公司,融资是0,却拥有1000万人的社区和一亿美金的营收?

为什么大厂纷纷追赶了一年,Midjourney 却还能一路领先?

看了去年Midjourney 创始人David 的访谈,大受启发,摘要如下。

也许能从中收获一些答案。

人类的基础设施,想象力

  • Midjourney 的目标之一是建造新的人类基础设施
  • /imagine‌‌“创造一个更有想象力的世界‌‌”,世界上最大的风险之一是信仰的崩溃,对我们自己的信仰,对未来的信仰。部分原因是缺乏想象力,对我们能成为什么缺乏想象力,对未来能成为什么缺乏想象力。想象力是我们这个世界所需要的重要支柱。

生成速度

  • 为什么是60秒,实际用两个版本测试,60秒比10秒的版本效果好很多,人们不需要盯着屏幕,可以做点什么事情再回来并收获几张效果不错的图片。

机器人和帆船

  • 聊天机器人不应该试图成为一个人,机器人不是在和人类一起工作,而是一种人类的交通工具。所以我们的logo是一艘小帆船。在旅途中你看到了什么风景?这就是Midjourney。

MidjourneyDiscord

  • 使用Discord 是因为远程团队需要用它办公。大家在调试过程中看到这些AI图片会觉得很有趣,为什么不让用户也来看看呢。然后就开放给用户,看到人们实时交流想法,创造了富有想象力的环境,分享了知识。这看起来太好了。于是坚定地要做一个Discord 服务。

群体观察学习

  • 普通人如何更好地理解产品?你不需要问别人,这样会觉得自己很蠢。你只需要坐着观察,这就是人类学习的方式。
  • 一个人的时候,最后会变得无趣

‌‌“这是一台机器,可以为你画出任何你想象出来的东西‌‌”用户‌‌“狗‌‌”你还想要什么?用户‌‌“大狗‌‌”还有呢?用户‌‌“大毛毛狗‌‌”

  • 一群人的时候,最后会得很有趣

用户A‌‌“狗‌‌”用户B‌‌“太空狗‌‌”用户C‌‌“带激光的太空狗‌‌”用户D‌‌“带激光和天使翅膀的太空狗‌‌”

用户群体Midjourney 是Discord 上面最大的群组,超过1000万人,Discord 并不是为了这么大的群组而设计的,甚至Midjourney的用户群体范围也已经超出了Discord 的用户定位。45岁以上和18岁以下的人一样多。

产品体验,情感共鸣根据以前的经验,从第一天开始,你必须了解你的市场,你必须知道产品的六个用户步骤是什么。他们试图创造所有这些复杂性但这并不重要,重要的是人们有一种情感共鸣的体验,让他们产生情感反应。在某种程度上,我认为如果人们对你的产品有情感反应,你就已经成功了80%。

没有VC但不代表没有资源

  • 在leap motion 的创业经历了创伤。所以目标是设计一个不需要投资就可以运作的实验室。
  • 我不需要去找任何人,向他们解释我的业务是什么
  • 有了Leap motion 的经历,就有了信誉。当我需要找一个云供应商给我10,000个gpu时,我可以给云供应商的负责人发电子邮件说,‌‌“嘿,这是大卫在做一件事。‌‌”,这是一个巨大的优势。

定价

  • 第一个月是赔钱的,因为高级用户的用量太多,
  • 于是增加了措施来避免滥用
  • 之后开始赚钱,却开始降低利润率,因为不需要这么高的利润
  • 只是努力为所有用户提供更好的服务

负载平衡

  • 如果你制作一张图像,世界上有八个不同的地区可以制作这张图像,而你完全不知道。它可能会在韩国、日本、荷兰或其他地方制造。它会到八个不同的区域,gpu在这八个区域之间进行平衡。
  • 这感觉有点像苹果公司在生产iPhone时所做的物流工作,并确保供应链良好。我们几乎有了一个计算供应链,这是一个非常有趣的概念,我认为在大型模型之前基本上不存在。