我在试着理解Q-Learning,
我目前的算法如下:
1.查找表是维护的,它将状态映射到每个可用操作的即时奖励和实用信息。
2.在每个状态下,检查它是否包含在查找表中,如果没有,则初始化它(默认实用程序为0)。
3.选择可能采取的行动:
(*ϵ* = 0>ϵ>1 - probability of taking a random action)
1-ϵ = Choosing the state-action pair with the highest utility.
ϵ = Choosing a random move.
ϵ decreases
我对在JOGL2中使用着色器而不是固定函数管道来编写OpenGL应用程序很感兴趣。我需要在CPU端做相当多的4x4双精度矩阵数学运算,以取代固定函数管道的推送/弹出/转换业务。同样的应用程序还将包含一些机器学习代码,这些代码需要对大矩阵进行操作。我看过用于机器学习的JBLAS (由于我已经在使用JNI for JOGL,依赖于另一个本地库的缺点很小),但我不确定它是否是与GL相关的矩阵的最佳选择。有什么想法?
我刚刚开始学习Java。我已经知道了如何编译和运行我的程序。我的最终目标是在Java上为web创建一些动画。
在下面你可以找到我的HTML代码示例。Java示例
<Body>
This is my page<br>
Below you see an applet<br>
<Applet Code="HelloWorldApp.class" width=200 Height=100>
</Applet>
</Applet>
</Body>
</Html>
这是我的HelloWor
我刚开始在iTunes上学习斯坦福大学的CS106a课程,但我遇到了一些问题。下面是我的代码:
/*
* File: Add2Integers.java
* -----------------------
* A simple ConsoleProgram to add two integers
* and display their total.
*/
import acm.program.*;
public class Add2Integers extends ConsoleProgram {
public void run() {
/* So all y'