Home
大话增强学习4

我前面有3个篇幅介绍了增强学习,快一年过去了。回头一看,很诧异居然是我自己写的,不天天惦记真的就忘了,好在再看一遍立刻又都回忆起来了。 温故知新 大话增强学习1 大话增强学习2 大话增强学习3 值和策略 增强学习算法大体有两类。 Value-based 前面讲的3章都可以认为是value based。它学习状态的value和所有action的期望价值(

GAN生成对抗模型

简单介绍一下生成对抗模型,并提供可以使用的TensorFlow代码

高通Hexagon DSP简介

来源:http://www.qualcomm.cn/news/blog-2015-08-26 Qualcomm Technologies非常荣幸地向大家介绍这款全新架构:Qualcomm Hexagon 680 DSP(数字信号处理器),它将集成于骁龙820处理器。使用DSP,

电商本质上是个库存计划问题

电商可以说是"速度经济"的代表:消费者不但期望批量经济下的价格、大规模定制下的选择,而且希望鼠标一点、几个小时后就能送货上门。虽说不要店面,但电商的种种成本,远超一般人的想象。很多传统公司跨入电商,例如美特斯邦威、红星美凯龙、飞虎乐购,

随机森林和GBDT的区别

随机森林 随机森林是一个用随机方式建立的,包含多个决策树的集成分类器。其输出的类别由各个树投票而定(如果是回归树则取平均)。假设样本总数为n,每个样本的特征数为a,则随机森林的生成过程如下: 从原始样本中采用有放回抽样的方法选取n个样本; 对n个样本选取a个特征中的随机k个,用建立决策树的方法获得最佳分割点; 重复m次,获得m个决策树; 对输入样例进行预测时,每个子树都产生一个结果,采用多数投票机制输出。