(4)这我想到了神经网络的本质:一个复杂的非线性系统来拟合你的问题。无论是CNN,RNN或者transformer都是对问题一种拟合罢了,也没有孰优孰劣。n0609
就一个受限的问题来看,可能有个高低之分,但我相信随着数据量的增加,问题的效果可能最终取决于模型的计算量和参数,而不是模型是哪个,因为之前的工作已经证明:一个三层神经网络可以逼近任何一个非线性函数,前提是参数足够大,而且更重要的是你找到一个好的训练方法。
未来虽然很难说,但依然可期!
【1】http://www.zhihu.com/question/437495132/answer/1656908750
【2】http://www.zhihu.com/question/437495132/answer/1658559732
【3】http://www.zhihu.com/question/437495132/answer/1656610825