Fetch the repository succeeded.
import numpy as np
import pandas as pd
N_STATES = 6
ACTIONS = ['left', 'right']
state = 2
def build_q_table(n_states, actions):
table = pd.DataFrame(
np.zeros((n_states, len(actions))), # q_table initial values
columns=actions, # actions's name
)
# print(table) # show table
return table
q_table = build_q_table(N_STATES, ACTIONS)
state_actions = q_table.iloc(state)
max = q_table.idxmax()
print(q_table)
print()
print(state_actions)
print()
print(max)
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。