takato

[搬运]DeepZip,用 RNN 来无损压缩内容,效果惊人

  •  
  •   takato · Jan 2, 2018 · 5756 views
    This topic created in 3094 days ago, the information mentioned may be changed or developed.

    论文地址: https://web.stanford.edu/class/cs224n/reports/2761006.pdf

    结果如下: https://i.v2ex.co/j2TaTIE3l.png

    在有限数据集下很厉害。。。

    9 replies    2020-06-30 12:20:03 +08:00
    nazor
        1
    nazor  
       Jan 3, 2018 via iPhone   ❤️ 6
    piped piper
    6388xE5FRKTNUT9x
        2
    6388xE5FRKTNUT9x  
       Jan 3, 2018 via Android
    前段时间看见了用深度学习做索引的工作。,
    takato
        3
    takato  
    OP
       Jan 3, 2018
    说不定我们的神经元信息也能压缩得如此简洁。你们说有可能吗?
    @nazor
    @showgood163
    Xs0ul
        4
    Xs0ul  
       Jan 3, 2018 via Android
    看起来,loss 并没有跑到 0 ?所以解压的结果还没对
    disposablexyz
        5
    disposablexyz  
       Jan 3, 2018 via iPad
    看了一下论文,可以说是非常厉害了,你的图片结果中的前四项是随机生成的 Pseudo-random-number-generated sequences (PRNG),论文作者说它之所以可以压缩到这么小是因为 DeepZip 实际上发现了这并不是“真”随机序列,非常有意思。
    作者还说 DeepZip 对于纯文本的压缩表现不是很好,大概是因为文字没有太多 dependency ?
    对于染色体这样 dependency 很多的?目前 DeepZip 已经比市面上的表现出色很多了,虽然慢很多多。
    6388xE5FRKTNUT9x
        6
    6388xE5FRKTNUT9x  
       Jan 3, 2018 via Android
    @takato 神经元的物理信息需要量化才之后才可以被压缩,量化层级比较少的时候信息量也较少,压缩相对容易些。
    6388xE5FRKTNUT9x
        7
    6388xE5FRKTNUT9x  
       Jan 3, 2018 via Android
    @Xs0ul 哈,想到一起了。不知道这里无损的标准是什么
    takato
        8
    takato  
    OP
       Jan 3, 2018 via iPhone
    @disposablexyz 对,其实神经网络发现了那个是一个有限信息空间,信息频谱存在可以“折叠”的部分,不知道这个比喻是否恰当。
    sonack
        9
    sonack  
       Jun 30, 2020
    没有啥卵用 相当于每次编解码都要重新训练模型,速度太慢了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3018 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 67ms · UTC 14:38 · PVG 22:38 · LAX 07:38 · JFK 10:38
    ♥ Do have faith in what you're doing.