总访问量:

欢迎访问! 登录

组会:神经网络基本原理及其简单应用----闫钊

更多组会报告

神经网络基本原理及其简单应用----闫钊

徐娟,July 3, 2022

      神经网络是受生物处理信息结构的启发,通过模拟人类神经元的结构和工作原理,进行信息的并行处理和非线性转化。经过多年发展和完善,目前在声音、人脸、指纹和图像识别方面已有初步应用。尤其在引入“深度学习”这一概念后,在人工智能相关领域取得很多成果。

     报告人首先简单总结了神经网络发展史,从二十世纪中期神经学家Warren和数学家Walter最先提出的Mccolloch-Pitts(MP)模型;到八十年代Geoffrey Hinton在原有前向神经网络加入了偏差,提出了通过链式求导法则进行反向传播的反向传播算法;再到最新的深度学习的开展。

     其次以传统的三层神经网络模型为例,详细讲解了神经网络的工作原理:输入层、隐藏层和输出层之间是如何构建矩阵关系,如何采用反向误差传播法来计算误差的权重,在较多权重组合难以逐个进行测试时,应运而生的梯度下降法。

     随后从神经网络模型的缺点出发,提出了相应的改进方法如改进激活函数,预先训练权重,提高泛化能力和自适应调整学习率。然后简单介绍了深度学习相关的三个算法:卷积神经网络(CNN)、长短期记忆网络(LSTM)和强化学习(RL)。

     最后报告人就神经网络在拟合第一性原理的势能面上的应用,并以碳原子神经网络势的构建作为成功案例,提出这一理论模拟在高温高压科学研究方向的潜力。

















 

附加信息:

讨论板块

你必须登录之后才可以参与讨论。

通讯地址 安徽省合肥市金寨路96号中国科学技术大学东校区环境资源楼814
邮政编码 230026
电子邮箱 zbj0601@ustc.edu.cn
电话 +86-551-63606255
皖ICP备05002528号-1