不会体系化建模,那数据治理不就是瞎搞吗?

不会体系化建模,那数据治理不就是瞎搞吗?
本文基于美团配送数据治理的历程,重点和大家分享一下配送数据“底座”的建设与实践。如何通过体系化建模建立起数据定义到数据生产的桥梁,达成数据定义、模型设计、数据生产三个环节的统一,消除因数据标准缺失和执行不到位

阅读全文>>

阅读全文...

谷歌AI一次注释了10%的已知蛋白质序列,超过人类十年研究成果

谷歌AI一次注释了10%的已知蛋白质序列,超过人类十年研究成果
蛋白质是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。目前已知存在的蛋白质种类有数十亿,但其中大约有三分之一的功能是不可知的。我们迫切地需要探索这片未知区域,因为它们关系到抗菌素耐药性,甚至气候变化等

阅读全文>>

阅读全文...

表征学习:为自然语言而生的高级深度学习

表征学习:为自然语言而生的高级深度学习
通过半监督学习和自我监督学习的某些特征,表征学习大大减少了训练模型所需的数据量,更重要的是,它更加重视阻碍传统监督学习中带注释的训练数据。它也促进了多任务学习(multitasklearning)

阅读全文>>

阅读全文...

表征学习:为自然语言而生的高级深度学习

表征学习:为自然语言而生的高级深度学习
通过半监督学习和自我监督学习的某些特征,表征学习大大减少了训练模型所需的数据量,更重要的是,它更加重视阻碍传统监督学习中带注释的训练数据。它也促进了多任务学习(multitasklea

阅读全文>>

阅读全文...