-
最近,Airbnb机器学习基础设施的进步大大降低了将新的机器学习模型部署到生产环境的成本。例如,我们的ML Infra团队建立了一个通用的功能库,该功能库使用户可以在模型中利用高质量,经过审查的可重用功能。数据科学家已开始将几种AutoML工具整合到他们的工作流程中,以加快模型选择和性能基准测试的速度。此外,ML infra创建了一个新框架,该框架将把Jupyter笔记本自动转换为Airflow pipelines。
-
Pythonista 数据科学家 Elior Cohen 近日在 Medium 上发文解读了最常见的三大降维技术:PCA、t-SNE 和自编码器。为了帮助理解,他还为其中每种相关算法编写了代码(也发布在了 GitHub 上)。
-
Python 比较慢,特别是在写循环的时候,运行速度慢的非常明显,这里介绍一个Python中加速的包。
-
LaTeX,是一种基于TeX的排版系统(ps:TeX的版本号非常有趣),由美国计算机科学家莱斯利·兰伯特在20世纪80年代初期开发,利用这种格式系统的处理,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学、物理文档。现在国内很多高效论文都使用LaTeX排版。
-
GitLab是一个利用Ruby on Rails开发的开源应用程序,实现一个自托管的Git项目仓库,可通过Web界面进行访问公开的或者私人项目。
-
薅羊毛拿下的服务器放着吃灰,还不如用来搭建一个私人的GitLab服务器玩玩