摘自《传习录》

“立志用功,如种树然。方其根芽,犹未有干,及其有干,尚未有枝,枝而后叶,叶而后花、实。初种根时,只管栽培灌溉,勿作枝想,勿作叶想,勿作花想,勿作实想。悬想何益?但不忘栽培之功,怕没有枝叶花实?”

机器学习中令人激动的趋势

从 jeff dean的演讲中记录的. https://www.youtube.com/watch?v=oSCRZkSQ1CE 一些观察 机器学习让计算机不断打破我们对于计算机能做什么的期待 不断变大的计算、数据、模型规模带来了更好的结果 我们需要硬件执行的计算类型快速地改变了 计算机能做什么 图像分类 语音识别 翻译 图像识别和描述 反过来也行 从描述生成图像 语音合成 ImageNet 的图像分类准确度从2011年的50.9% 到2021年的90.88% 语音识别的错误率从13.25%下降到2.5% 趋势 大算力可以极大地改进模型,深度学习改变了我们设计计算机的方式: 针对机器学习优化的硬件越来越高效。 机器学习计算特征 不需要非常高的精度 –降低精度可以提高运算速度,但是不怎么影响效果 特异化的操作—主要是矩阵计算 语言模型的15年历史 2007年, 大规模的N-gram模型,用在翻译算法中。 2013年,词向量技术 2014年,Sequence to Sequence 翻译 2015年, 多回合的神经对话模型 2017年, Attention Is All You Need ,是对15年的工作的并行化优化迭代 2020年,Meena Transformer 架构的对话模型 2022 年,chatGPT 2023 年,Bard Gemini 多态模型 大模型的训练 基础架构 映射物理计算设备 资源的热加载和移除 数据自动路由 高度可扩展性 大规模训练 最小化失败的可能性 最快的恢复时间 训练数据 高质量的数据对于模型训练非常重要 怎么更好地问模型问题 让模型一步一步展示思考过程很有用,思维链模式 模型评估 评估模型的优势和弱势 学术考试和评估 趋势 在通用模型的基础上调优可以带来效果非常好的领域模型 生成模型可以生成高质量的图片、音乐、视频 机器学习给个人和社区都带来了更多好处 机器学习影响和加速了很多其他学科,工程的发展。 材料设计、药物设计、医学影相处理 更好地理解机器学习,更加深入&广泛 总结 AI 让计算机更好的理解,觉察和推理这个在他们周围的世界。

社区门槛的设想

社区的发展和运营经常会面临的问题是: 随着社区发展,社区的质量越来越差,导致高质量的用户渐渐流失。 为了建设一个小而美,持久的社区,需要为加入社区的用户设置一个门槛: 可以是付费加入。 可以是通过域名验证加入,类似Google console 会交验用户的域名所有权一样。 付费加入可以为社区提供基础的运营经费。 域名验证可以提高用户的准入门槛,可以为高质量用户自身的网站引流。 社区可以获得用户高质量的博文,解决流量从哪里来的w

浏览器的Tab管理

Chrome是我工作中最常用的浏览器,但是它的Tab管理确实是一团糟。经常会遇到工作一天之后,CHrome的浏览器Tab开了一堆,要找到之前的Tab简直比登天还难。 浏览器的窗口管理 在chrome大行其道之前,IE是流行的浏览器之一,IE在新建窗口的时候就真的是在你的桌面上新建一个窗口,也许当时的用户工作一天之后桌面上会是一堆的窗口?当时的网页功能肯定没有现在这么强大,不是所有的应用都是运行在网页上的。 chrome已经在IE的基础上进行了改进,通过Tab来管理新建的窗口,至少我们不用看到桌面上的一堆浏览器窗口。Chrome的界面UI设计在刚问世的时候也是以其简洁、快速著称的,它也因此赢得了市场。 问题从桌面上的一堆窗口变成了一条Tab栏上的一个个Tab。这条Tab栏是有上限的,一般来说在10个tab左右就已经填满了整条Tab栏。按照我自己的习惯同时开启的Tab远在这个数字之上,Chrome的Tab页面至少在40个以上,而且习惯开启新的Tab但是不习惯关闭Tab。当我们的Tab栏都看不清标题分不清哪个Tab是你要切换寻找的,这时候我还倾向于新建一个Tab,而不是在一大堆Tab中寻找之前的Tab(除非这上面有我依赖的数据,新建一个需要重新操作一遍)。一天的工作结束之后会发现这些窗口中很大一部分都是一次性的,没有意义的中间窗口,例如导航类型的页面,搜索中间页面等等。 Chrome也在改进Tab页面的设计 引入了Tab分组,支持在已经开启的Tab页面中搜索,但是实际使用中并没有多大程度地解决问题。 Edge、Arc等浏览器开始抛弃最原始的Tab栏的桎梏,开始尝试竖排的Tab页面管理。 为什么? 为什么我们的浏览器页面会变得如此拥挤? 拆解和分析一下这个问题,会发现我们的问题变成了,为什么我们要新建一个浏览器Tab?这个问题很简单: 用户主动通过url打开Tab 比如我想要搜索一个主题,我会打开google进行搜索,或者直接在Tab栏搜索,这都会新建一个Tab 网站的新建 这不是用户的行为,更多的是网页的设计,例如Google搜索完成之后会有google 的搜索结果页面,当我点击其中一个搜索结果的时候Google可以选择在新的Tab页面中打开搜索结果网页,也可以选择forward,覆盖现有的搜索结果。(现在baidu的默认是新建Tab,Google采用的是forward的方案) <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Open Link in New Tab or Same Tab</title> </head> <body> <a href="https://www.example.com" target="_blank">Open in New Tab</a> <a href="https://www.example.com" target="_self">Open in Same Tab</a> </body> </html> 竖排标签管理 现代用户的屏幕大多是16:9甚至更加宽的比例,在空间上宽会比高更加富裕。竖排的标签不会因为标签过多导致标签名称被挤占,因为竖排之后标签管理的宽度是可调整的,新的tab排列是竖向的,标签名称是横向的,不在一个方向上。 树状标签管理 用户的标签是否可以组织成一颗二叉树一样的形式。 https://chromewebstore.google.com/detail/tree-style-tab/oicakdoenlelpjnkoljnaakdofplkgnd 看上去已经有人在做类似的尝试,先试用一下看。 目前在使用的是 https://chrome.google.com/webstore/detail/nelmjkbalflkmcnnnhjgiodpndcebfgo 插件基本实现了树状Tab管理的基础功能,由于是插件的原因,功能打磨上没有arc做得那么好,也占用了挺多屏幕空间 新建Tab tree tab可以让tab页面之间的生成逻辑更加清晰,不知道有没有插件可以减少新Tab页面的创建。会不会改造的最后就是zuo c

计算机交互发展de历史以及畅想

计算机的发展经历了几个阶段 纸带打孔 点 字符终端 线 图形化桌面 二维平面(黑白) 触摸、语音、视频 二维平面(彩色) 立体交互. 三维空间 意识识别、脑机接口 高维度 这是个很有意思的比喻。推动计算机的交互发展基础其实是计算机输入输出的带宽不断提高。因为带宽和算力不断提高所以新的交互输入以及交流的方式成为了可能。 纸带打孔 计算机的上古时代,人类通过纸带来记录数据。上面可能包含代码和数据。但是可以想见这种机器的传输带宽是非常小的。 如果用几何图形来比喻的话,这时候还真的只是个点吧,代码是以点来存储的,计算机读取这些点来执行计算。 终端字符 计算机进入了终端命令的时代了,人们不再依赖点来存储自己的代码和逻辑了,使用计算机需要在一个黑框框里面输入一堆命令来让计算机执行需要的计算。但是这已经是非常大的进步了。 图形化窗口 施乐公司最先发明了图形化的窗口和操作系统。这个设计被苹果和微软带进了千家万户。计算机图形化也伴随着计算机的个人化,一切都变得更加容易操作了,计算机的易用性有了大大的提升。 很多人质疑图形化的界面是否有更高的效率,这些大多是习惯和热爱技术的人,往往不是一般用户。 二维平面的窗口让交互更加直观了。 移动计算 移动计算是桌面计算机的又一次小型化。手持设备的发展并没有和桌面计算机完全分开,但是移动设备的性能和实用性一开始都不足以完全替代桌面计算设备,但是从iPhone时代开始,移动设备的可用性慢慢达阈值,现在的iPhone以及可以开始运行一些3A大作了。使用手机但是不用电脑的用户也越来越多了。 空间计算 所有体验过空间计算(VR)设备的人都会在第一时间确定,是的这就是下一代的计算形态。人们从平面的电脑窗口和手机屏幕上进化到三位立体的交互界面了,多了一个维度的质的飞跃。 每一年都会被很多人认为是VR元年。人们很早就开始构建类似的设备了,技术一直在进步,但是都无法正真的实现空间计算。 我记得当年诺基亚有个侧滑的手机N97, 从设计和宣传上来说,人们对他的期待就是一台移动的小电脑,但是这一直都只是一种期待。那个时代的手机还是性能过于孱弱,无法替代桌面电脑。 VR的计算依赖基础技术的进步,需要达到一些基本的诉求,然后才能迎来自己的时代 佩戴体验 电池续航 画面体验 计算能力 脑机接口 这也许是空间计算之后的一个畅想了。之前的交互界面一直都是试图构建在人类的感官之上,通过视觉,手指来操作。 脑机接口是直接绕过这些感官,直接将所谓的“意识”和计算机相连,当我们想一件事情的时候,计算机就已经知道。我们不在受到交互界面的限制。 例如我在创作这篇文章的时候还是通过键盘来输入的,但是如果脑机接口成熟了,我都不需要键盘,我只要想到,文章自动输入到电脑上了,这无疑带来了输入带宽的极大提升。 还有一点,如果我们都能直接感知到一个人的想法了,那么文字还那么重要么,文字通常来说是具象的,是我们思维的一种投射。但是我们都能直接理解意识的本体了,我们还需要这种投射么,我们可以直接将我们的喜怒哀乐读取出来之后告知给另一个人,人们终于可以切身体会到另一人的想法,不再有文字这种中间媒介的传输损耗。 但是也有另一种想法,费曼说他的草稿纸就是他的思维,而不是先思考完毕再写在纸上。文字本身就是思维思考的过程,如果没有了文字,没有了草稿,也就不算是思考了。如果没有了媒介我们的想法何以承载呢?

Sony TX-900C

=538x717 换了个新的遥控器。新的型号增加了夜光还有寻找遥控器的功能。Sony终于是get things right 了。 如果你在淘宝上搜索一下,这玩意儿居然能卖到那么贵。 最简单的方式是在微信上找一下索尼售后的小程序,选一下预约换新。然后走一下这个流程,售后工程师会让你把钱打过去,然后他们把遥控器寄过来。 然后就耐心等待就行。 Boom 你有了一个新的小玩具。 题外话: 虽然这只是一个简单的遥控器,但是却让我思考了好多。我不想聊关于索尼的遥控器的设计是否合理的问题,已经有好多人说过这个问题了。我想聊一下为什么我,“我们”,经常会需要一个新的“遥控器”这个问题。 我们来简单地剖析一下这个问题,然后抽象提炼一下看: 单纯地看我为什么想要一个新的遥控器呢? 因为旧的不好用 因为我知道有一款新的好用的遥控器 我还知道新的型号附带一些新的功能 我为什么可能想要一辆新车呢? 如果我原本没车,那么一辆车可以让我极大扩展自己的生活半径,提升自己的生活幸福感 要是我有,新换的车也许可以有新的功能,更智能的车机,更大的空间,也是是因为喜欢马斯克 有了这么一辆新车,我们可以在节假日的时候载着全家人一起出去玩,哇,多么温馨的画面 我为什么想要一个新的iphone呢? 哇,这可是新的iPhone呀,有个灵动岛,这可是最新的设计 有了电影模式的摄像能力,可以给宝宝拍下更好的照片,这买的不是手机,这买的是童年呐 有了新的type-c 的接口,这下我就不需要再出门带那么多的充电线了。All type C,see I have a good taste, lighting 是什么该扫尽垃圾桶的接口呀 我为什么想要一件新的衣服呢? 我没有这个颜色,这个设计,这个款式的 这个用来搭配的我的鞋子刚刚好非常合适 可以在下次出游的时候穿出去,一定非常出片 我为什么想要xxxx balalalalall bablallalal cxxxxxx 那么人们为什么想要一件新的东西呢?为什么有些人想要急迫地想要买一个新东西呢?在我对于换到手的新遥控器爱不释手的时候,丫丫可能并不理解为什么。从旁人的角度来看不就是个显示器么?他的基础功能有什么不一样么?并没有,一样都是遥控器,原来的遥控器就那么难按么?不见得,习惯了之后都可以盲按。我们花钱买了我们以为可以给我们生活带来更大便利的东西,我们甚至为之有些上瘾了?但是我发现这就是个新的遥控器,在功能本质上没有什么大的变化,我需要语音找遥控器么?一年可能都用不上几次,我一定要金属面板的遥控器么?塑料的怎么就不行了吗?人们会因为幻想买自己实际上不需要的东西。 怎么知道自己实际上是否需要一件东西呢? 我想到了一个简单的办法,不要从你自己主观的角度出发?不知你在使用这个遥控器,你的家人,小孩儿,朋友?老婆在用这个东西,你觉得你需要买个新的给他们么?有这个必要性么?如果没有那么大概率你也没啥太大的必要性买个新的给自己。 是的,我们生活在一个日新月异的世界,事物总是在进步的。消费主义能让人上瘾,感觉可以买到开心和快乐,但是这种多巴胺的分泌只会一次一次地拉高我们的期望,我们只会购买地更多。多巴胺是人类进步的动力,但是就像所有的工具和机制都需要一个合适的地方来发挥其作用一样,任何的机制也有可能被滥用。 当多巴胺分泌的时候人们的预期被拉高了,在没有新鲜的事物或东西能满足人们的欲求的时候,人类就会痛苦。就像是物理中的能量守恒定律一样,人类的快乐和痛苦通常来说也是守恒的。 这背后是我们对人类内在的奖励机制的理解。这套奖励机制的正确且合理的运行是个人平稳前进的基础。 正如前面所说,如果快乐变多了,随之而来的痛苦和平到会增多。如果我们主动地追寻困难或者有挑战的事情,那么平日里的日子也可以变出淡淡的幸福。 学习了解自己的奖励机制,利用它来引导我们前进的方向。 我需要一个新的遥控器么? 也需要,我需要他给我的奖励系统一些刺激 但是也许不需要,我需要的是给我的奖励系统一些刺激,而不是一个新的遥控器。 程序员中很多人喜欢折腾自己的博客,但是大多数折腾完成之后,写了几篇关于折腾博客的记录,之后便很少再去写新的文章了,这也是不知道自己到底要的是什么,是真的需要一个blog还是喜欢“折腾”这个过程本身。喜欢“折腾”其实没什么问题,但是不要为此让自己只是不停地折腾,人们总要“build” something,而不是一直拿着一把漂亮的工具但是并不构建什么东西,而是一直在打磨和装饰他的“🗡️”。