什么是人格| 荷花代表什么| 大v什么意思| ipf是什么病| 东方蝾螈吃什么| mr是什么意思| 柳丁是什么水果| 甲亢的早期症状是什么| 小女子这厢有礼了什么意思| 白内障是什么引起的| 前方起飞是什么意思| 什么病会导致不来月经| 3月什么星座| 怀孕后乳房有什么变化| 什么样的房子不能住人脑筋急转弯| 一般细菌培养及鉴定是检查什么| 什么是色盲| 军区司令是什么级别| 内膜欠均匀是什么意思| 海带什么人不能吃| 营养不良吃什么药| 秦国是现在的什么地方| 臀疗是什么| 尿酸高什么原因引起的| hpv什么意思| 眼睛痛是什么原因| 预检是什么意思| 甲沟炎去医院挂什么科| 喝酒手麻是什么原因| 肾阴虚火旺有什么症状| 扳机指是什么原因造成的| 高胆红素血症是什么病| 四眼狗有什么迷信说法| 浮水是什么意思| 哥斯拉是什么| 1977年五行属什么| 十五岁是什么年华| 姓名字号是什么意思| 肌酐高是什么原因引起的| 居住证签注是什么意思| 心脏什么情况下需要支架| 意难平是什么意思| 宫颈管积液什么意思| 肚脐眼连接体内的什么器官| 什么时候刮胡子最好| 怀孕前期有什么征兆| 什么叫免疫组化| 女的什么时候退休| 过敏了吃什么药好| 日照香炉生紫烟是什么意思| 形态是什么意思| 血压高什么不能吃| 甘油三酯高吃什么食物降得快| 肾内科是看什么病的| 什么减肥药最管用| 鸡的守护神是什么菩萨| 醋纤是什么面料| 12月13日是什么纪念日| 孕妇建档是什么意思| 宝宝积食吃什么| 查尿酸挂什么科| 尿路感染什么症状| 什么时候用得| 九月份什么星座| 喉炎是什么原因引起的| 今天什么属相| 恐惧症吃什么药最好| 揶揄什么意思| 口臭去医院挂什么科室看病| 长脸适合什么发型女| 吃地瓜叶有什么好处和坏处| 文火是什么火| 天丝是什么成分| 轻微骨裂了有什么表现| 太公是什么意思| 母亲吃什么退婴儿黄疸| 开诚布公什么意思| 天秤座什么象| minute是什么意思| 准生证有什么用| 卵泡是什么意思| 细菌性肺炎吃什么药| 脂溢性皮炎是什么原因引起的| 吃什么补肾壮阳最快| 米诺地尔搽剂和米诺地尔酊有什么区别| 有什么可以快速止痒的方法| 汗斑是什么样的图片| 莲雾吃了有什么好处| 女生做彩超是检查什么| 用纸可以折什么| 女性睾酮低意味着什么| 357是什么意思| 虎什么熊什么| 梦见死人复活什么预兆| 硬度不够是什么原因| 畏寒肢冷是什么意思| 衣原体感染吃什么药| 圣女是什么意思| 沃尔玛是干什么的| 梅花什么时候开花| 为什么会得卵巢癌| autumn什么意思| 为什么会有头皮屑| 胃肠感冒发烧吃什么药| 鱼平念什么| 舍本逐末什么意思| hpv什么症状| 手上起倒刺是缺什么| 魁罡贵人是什么意思| 面粉可以做什么| esd手术是什么意思| 神经性皮炎用什么药最好| 妇科凝胶排出的是什么| 寂寞是什么意思| 检查过敏源挂什么科| 鸡腿炒什么菜好吃| 晚上看见黄鼠狼有什么预兆| 男人艾灸什么地方壮阳| 什么动物的血是蓝色的| 茶宠为什么会变色| 什么叫间质性肺病| 吃什么治白头发| 妈妈桑是什么意思| 卵巢结节是什么意思| 本来无一物何处惹尘埃是什么意思| 中国国鸟是什么鸟| 手热脚热是什么原因| 单亲家庭什么意思| 梦见小孩是什么| 尿液特别黄是什么原因引起的| 肚子左边是什么部位| 只出不进什么意思| 黄瓜片贴脸上有什么效果| 睡眠不好是什么原因| 肚子跳动是什么原因| 虚胖是什么意思| 多吃蔬菜对身体有什么好处| 洗牙挂什么科| 蛋糕裙搭配什么上衣| 吃生姜有什么好处| 甲状腺五类是什么意思| 1983属什么生肖| 梦见龙是什么意思| 什么叫原研药| 乙肝是什么病严重吗| 什么是出柜| 叩首是什么意思| 硬度不够吃什么药| 脂肪的克星是什么| 腊八节吃什么| 头晕眼睛模糊是什么原因| 淋证是什么病| 关节炎看什么科| adhd是什么病| 用什么水和面烙饼最软| 小孩子眼睛眨得很频繁是什么原因| 手机号码是什么| 现在什么手机好用| 今年农历是什么年| 上火了吃什么药好| hcg翻倍慢是什么原因| 咳嗽发烧是什么原因| 小孩坐飞机需要什么证件| 百脚虫的出现意味什么| 吃什么水果美白| 肺坠积性改变什么意思| 洋气是什么意思| 大便不正常是什么原因造成的| 盛世美颜是什么意思| 右下腹有什么器官| 喉咙痛吃什么水果好得最快| 3680是什么罩杯| 红斑狼疮吃什么药最好| 吃什么食品减肥| 双子座和什么座最配对| 凌晨12点是什么时辰| 浪琴名匠系列什么档次| 喝酒脸红是缺少什么酶| 大姨妈每个月提前来是什么原因| 苦涩是什么意思| 蕈是什么意思| 睾丸炎用什么药| 诸法无我是什么意思| dragon是什么意思| 揽件是什么意思| 奇异是什么意思| lov是什么意思| 瓜娃子是什么意思| pnc是什么意思| 精子是什么味道的| 拉肚子为什么会发烧| 叶公好龙的好是什么意思| 五十知天命什么意思| 新斯的明是什么药| 文理分科什么时候开始| 眼下长斑是什么原因| 甘油三脂是什么意思| 燥是什么意思| 糖尿病能喝什么饮料| 文化是指什么| 田七是什么| 输卵管堵塞吃什么药可以疏通| 浑身发热是什么原因| 什么的麦子| 化脓性扁桃体炎吃什么药| 男生剪什么发型好看| 温度计代表什么生肖| 月经前腰疼的厉害是什么原因| 十八罗汉是什么意思| 翊是什么意思| 什么是阴阳水| 胃癌挂什么科| 多莉是什么鱼| 小孩子为什么老是流鼻血| 狗狗胰腺炎有什么症状| 猫是什么生肖| 月字旁的字有什么| 胎先露是什么意思| 父亲节什么时候| microsd卡是什么卡| 手心发热什么原因| 白内障用什么眼药水| 老年人喝什么蛋白粉好| 令人发指是什么意思| 1994年五行属什么| 单核细胞高是什么意思| 汗毛多是什么原因| 2001年属什么生肖| 气场是什么意思| 为什么蚊子喜欢咬我| 2003是什么年| 安陵容为什么恨甄嬛| 韦编三绝是什么意思| 凉皮是什么做的| 脉濡是什么意思| 中国第一个不平等条约是什么| 老公什么意思| 高血压喝什么茶好| 为什么乳头会痒| 大便有粘液是什么原因| 灶心土是什么| 药学是干什么的| 铊是什么东西| 煮粥用什么米| 冥想有什么好处| 7o年属什么生肖| 义眼是什么| 泥腿子是什么意思| 涤纶是什么面料优缺点| 大便一粒粒是什么原因| 乳腺增生应该注意些什么| 老是流鼻血是什么原因| 可怜巴巴是什么意思| 戊土是什么土| 硬汉是什么意思| 大致是什么意思| 一什么| 长疱疹是什么原因| 心颤是什么症状| 心跳过速吃什么药| 凤凰男是什么意思| 熠熠生辉什么意思| 为什么冬吃萝卜夏吃姜| 十一月十九是什么星座| 百度
Skip to content
tales from the digital vise

桑切斯世界波厄齐尔制胜,阿森纳客场2-1米堡

百度 所以对阵捷克队的比赛,国足最好的首发方案是扎堆中场人员,蒿俊闵身边需要派上了两个保护者,何超可以上,除此之外真要选择一个人,那就是号称中超加图索的上港铁腰蔡慧康,就他在上港的定位和表现来看,拦截能力还是有的。

Is compression equivalent to general intelligence? DeepMind digs up more potential clues.

Benj Edwards | 95
Story text

Effective compression is about finding patterns to make data smaller without losing information. When an algorithm or model can accurately guess the next piece of data in a sequence, it shows it's good at spotting these patterns. This links the idea of making good guesses—which is what large language models like GPT-4 do very well—to achieving good compression.

In an arXiv research paper titled "Language Modeling Is Compression," researchers detail their discovery that the DeepMind large language model (LLM) called Chinchilla 70B can perform lossless compression on image patches from the ImageNet image database to 43.4 percent of their original size, beating the PNG algorithm, which compressed the same data to 58.5 percent. For audio, Chinchilla compressed samples from the LibriSpeech audio data set to just 16.4 percent of their raw size, outdoing FLAC compression at 30.3 percent.

In this case, lower numbers in the results mean more compression is taking place. And lossless compression means that no data is lost during the compression process. It stands in contrast to a lossy compression technique like JPEG, which sheds some data and reconstructs some of the data with approximations during the decoding process to significantly reduce file sizes.

The study's results suggest that even though Chinchilla 70B was mainly trained to deal with text, it's surprisingly effective at compressing other types of data as well, often better than algorithms specifically designed for those tasks. This opens the door for thinking about machine learning models as not just tools for text prediction and writing but also as effective ways to shrink the size of various types of data.

A chart of compression test results provided by DeepMind researchers in their paper.
A chart of compression test results provided by DeepMind researchers in their paper. The chart illustrates the efficiency of various data compression techniques on different data sets, all initially 1GB in size. It employs a lower-is-better ratio, comparing the compressed size to the original size.
A chart of compression test results provided by DeepMind researchers in their paper. The chart illustrates the efficiency of various data compression techniques on different data sets, all initially 1GB in size. It employs a lower-is-better ratio, comparing the compressed size to the original size. Credit: DeepMind

Over the past two decades, some computer scientists have proposed that the ability to compress data effectively is akin to a form of general intelligence. The idea is rooted in the notion that understanding the world often involves identifying patterns and making sense of complexity, which, as mentioned above, is similar to what good data compression does. By reducing a large set of data into a smaller, more manageable form while retaining its essential features, a compression algorithm demonstrates a form of understanding or representation of that data, proponents argue.

The Hutter Prize is an example that brings this idea of compression as a form of intelligence into focus. Named after Marcus Hutter, a researcher in the field of AI and one of the named authors of the DeepMind paper, the prize is awarded to anyone who can most effectively compress a fixed set of English text. The underlying premise is that a highly efficient compression of text would require understanding the semantic and syntactic patterns in language, similar to how a human understands it.

So theoretically, if a machine can compress this data extremely well, it might indicate a form of general intelligence—or at least a step in that direction. While not everyone in the field agrees that winning the Hutter Prize would indicate general intelligence, the competition highlights the overlap between the challenges of data compression and the goals of creating more intelligent systems.

Along these lines, the DeepMind researchers claim that the relationship between prediction and compression isn't a one-way street. They posit that if you have a good compression algorithm like gzip, you can flip it around and use it to generate new, original data based on what it has learned during the compression process.

In one section of the paper (Section 3.4), the researchers carried out an experiment to generate new data across different formats—text, image, and audio—by getting gzip and Chinchilla to predict what comes next in a sequence of data after conditioning on a sample. Understandably, gzip didn't do very well, producing completely nonsensical output—to a human mind, at least. It demonstrates that while gzip can be compelled to generate data, that data might not be very useful other than as an experimental curiosity. On the other hand, Chinchilla, which is designed with language processing in mind, predictably performed far better in the generative task.

An example from the DeepMind paper comparing the generative properties of gzip and Chinchilla on a sample text.
An example from the DeepMind paper comparing the generative properties of gzip and Chinchilla on a sample text. gzip's output is unreadable.
An example from the DeepMind paper comparing the generative properties of gzip and Chinchilla on a sample text. gzip's output is unreadable. Credit: DeepMind

While the DeepMind paper on AI language model compression has not been peer-reviewed, it provides an intriguing window into potential new applications for large language models. The relationship between compression and intelligence is a matter of ongoing debate and research, so we'll likely see more papers on the topic emerge soon.

Listing image: Getty Images

Photo of Benj Edwards
Benj Edwards Senior AI Reporter
Benj Edwards is Ars Technica's Senior AI Reporter and founder of the site's dedicated AI beat in 2022. He's also a tech historian with almost two decades of experience. In his free time, he writes and records music, collects vintage computers, and enjoys nature. He lives in Raleigh, NC.
95 Comments
Staff Picks
r
But what about decompression rate? FLAC has always been noteworthy for being an asymmetrical codec which takes more computational power to compress than to decompress (potentially a lot more, depending on the settings used). If this new AI codec requires a lot of number crunching to decode, it may not be such a big win in all situations.
In terms of a practical format, FLAC/PNG are designed to be incredibly fast and lightweight because they have to be integrated into mobile devices, web browsers, etc without consuming huge amounts of memory and power. For example, FLAC is designed to be able to decode CD audio losslessly in realtime on DSP cores with single-digit MHz and tens of kilobytes of RAM while using the absolute lowest amount of battery. I'm not sure how much memory Chinchilla 70B requires, but seeing as the model has 70 billion parameters, I suspect it will not fit into 64 KB of memory on a low power embedded audio device.
高考什么时候恢复 诠释的意思是什么 维生素b3又叫什么 梦见车翻了是什么预兆 为什么警察叫条子
生死离别代表什么生肖 1月25日是什么星座 小211是什么意思 洗发水和洗发露有什么区别 子宫内膜厚是什么原因
十二指肠溃疡是什么原因引起的 寂灭是什么意思 体重除以身高的平方是什么指数 棉条是什么 社区医院属于什么级别
成本倒挂什么意思 龋齿挂什么科 5年存活率是什么意思 人头什么动 梦见种地是什么意思
养尊处优什么意思hcv8jop9ns2r.cn 晚霞是什么baiqunet.com 太字五行属什么yanzhenzixun.com 主动脉夹层a型是什么病hcv9jop0ns3r.cn 蚕除了吃桑叶还能吃什么hcv8jop6ns5r.cn
拔牙后吃什么食物最好hcv9jop7ns4r.cn 吃什么有奶hcv9jop1ns4r.cn 今年22岁属什么生肖hcv8jop2ns1r.cn 海龟汤什么意思hcv8jop6ns2r.cn 音调是由什么决定的hcv8jop2ns2r.cn
皮蛋为什么能治口腔溃疡hcv8jop8ns6r.cn 一喝牛奶就拉肚子是什么原因hcv8jop0ns5r.cn 头皮痒用什么洗发水效果好hcv8jop5ns7r.cn 肺心病是什么病hcv8jop9ns6r.cn 右手臂痛是什么预兆hcv9jop4ns8r.cn
爻辞是什么意思hcv8jop0ns7r.cn 胡饼是什么hcv8jop5ns2r.cn 什么什么大名hcv8jop0ns7r.cn 突然勃不起来是什么原因hcv9jop6ns7r.cn 手臂上长痣代表什么jiuxinfghf.com
百度