印度50年内会不会超越中国?
如何评价《灵笼 2》第六集?
如何看待苹果公司撤下“说服父母给你买一台 Mac”的广告***,上线仅一天?
武松杀嫂,为什么要先扯开她的胸衣,多此一举还是另有深意?
2025年6月,到底买油车还是电车?
如何评价高圆圆的身材算是美女类型的吗?
Mac mini M4,有必要升级24G内存吗?
评价一下Proxmox VE与ESXi的优劣?
为什么很多离异的30-40岁的女性,很难找到老公再婚?
《甄嬛传》中祺贵人为什么和甄嬛反目?
国内这么多码农,为什么出不来JetBrains, MathWorks这样的公司?
有一双超级大长腿是什么感觉?
华为中年粉丝都是什么样子的?
JetBrains 放弃 AppCode 是否是一个错误决定?
程序员都在用什么显示器写代码?
入职第一天有什么瞬间让你马上想离职的?
很好奇,组NAS的玩家是如何解决上传速率的问题?
女朋友送的switch被亲戚要求送小孩我该怎么办?
Tauri 为什么仍未取代 Electron?
央视怎么又开始报道伊朗的防空能力了?是有神秘的力量开始介入了吗?
网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)?
显示器选32还是27,2k还是4k?
在上海被骗了100w+,警察不予立案怎么办?
为什么有些男人眼里看不见家务?
国密加密算法有多安全呢?
电影《碟中谍》系列中哪一部最好?
微软edge浏览器为什么逐渐被其他的浏览器代替?
你们在公司是怎么使用k8s和docker的?
为何小米玄戒一出手便是麒麟终未达到的高度?
女生被踢裆也会很疼吗?
新买的移动硬盘该格式化为 NTFS 还是 exFAT?
《英雄联盟》三个解说里,那个总也插不进嘴的解说是什么感受?
食堂餐桌椅组合
学校食堂餐椅
工厂饭堂桌椅
四脚分体餐桌椅
钢木连体餐桌椅
玻璃钢连体桌椅
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。