100万长文本赋予了开发者更大的创造空间,同时在生成、推理、QA等能力上不再被制约,注定会吸引越来越多的开发者参与进来,进一步将想象力转化为生产力。 |
月之暗面128K的大模型,每次可以处理6.4万个汉字,需要12次才能读完; Claude 200K的大模型,每次可以处理10万个汉字,需要8次才能读完; GLM-4-Long实测可以处理150-200万字,一次就能读完一本《红楼梦》。
月之暗面128K的大模型,每次可以处理6.4万个汉字,相当于读1本《活着》; Claude 200K的大模型,每次可以处理10万个汉字,相当于一次读《活着》和《在细雨中呐喊》两本书; GLM-4-Long的1M上下文,可以一次读余华老师的多本书,比如《活着》《在细雨中呐喊》《河边的错误》《第七天》……
往期推荐
主理人 | 张贺飞(Alter)
前媒体人、公关,现专职科技自媒体
钛媒体、36kr、创业邦、福布斯中国等专栏作者
转载、商务、开白以及读者交流,请联系个人微信「imhefei」