首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   3篇
  免费   0篇
综合类   3篇
  2023年   1篇
  2013年   1篇
  2007年   1篇
排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
龚海波 《科技信息》2007,(9):147-147,188
在绘画中,艺术家所选择与运用的材质既是绘画的载体,同时其本身也是有各自独特的审美价值,有待于人们去认识。在运用材料创作的过程中,材料的特性及其所具有的独特视觉感染力,是我们在创作和欣赏艺术作品时不容忽视的,而且应该提到日程上来。在创作中,如果将材质的选择与运用恰如其分地与主题和内容融合成一体,就会使作品具有更生动、更强烈的艺术感染力,这是一个富有探索意义的课题。  相似文献   
2.
常用河流水质模型结构及其应用分析   总被引:1,自引:0,他引:1  
随着科技的发展,人类生产获取的物质越来越多,但是伴随物质的生产,大量的污染物质流人环境。其中相当大的一部分污染物质以无机化合物、有机化合物的形式进入河流。河流被污染后,不仅其难以自净,造成严重的生态环境问题,也给人类的生产生活带来极大的危害。对各类水环境污染问题,尤其是河流水污染的水质预报和各类可能造成河流污染生产项目进行水环境影响评价,已是我国水利、环保部门的重要工作之一。详细阐述了常用河流水质模型及各参数意义,进而给从事水环境监测、水环境影响评价等工作者提供借鉴。  相似文献   
3.
近端策略优化(proximal policy optimization, PPO)是从一个已知的分布附近来采样估计另一个分布,通过用新策略在老策略的附近学习来实现优化的,其中老策略作为新策略的近似分布。【目的】针对PPO算法在强化学习中学习效率及收敛性不够好的问题,提出一种改进的PPO算法。【方法】首先提出一种新损失函数来更新PPO算法中的网络参数,采用泛化优势估计(generalized dominance estimation, GAE)对优势函数进行描述;然后采用类似异步优势演员-评论家(asynchronous actor-critic, A3C)算法中的多线程策略来训练智能体;最后设计新的参数更新方式来实现对主副两种网络中的参数更新。【结果】本方法能够使智能体更快地完成学习训练,其训练过程中收敛性更好;由于多线程,其算法的训练速度会比常规的PPO算法至少快5倍。【结论】改进的PPO算法其性能更好,这为后续强化学习算法的研究提供了新思路。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号