ブログ

WordPress記事にYoutube検索結果を埋め込む方法(固定ページ)

概要 ここでは、Wordpress記事にYoutubeの特定のキーワードで検索した場合の 上位5つの動画を埋め込む固定ページテンプレートを埋め込む方法を紹介します。 完成イメージは以下のようなページになります。 このページは、「WordPr...
IT・プログラミング

Cloud Run Functions無料枠の注意点 Artifact Registryの設定

Cloud Run FunctionsとArtifact Registry 今回は、Cloud Run Functions無料枠を使っているときに費用が発生してしまったので、その原因をまとめたいと思います。 費用の内訳を確認すると、Arti...
IT・プログラミング

デジタルコンテンツ管理のベストプラクティスを考える

デジタルコンテンツは非常に便利です。 物理的なスペースを取らないので、簡単に大量に保存可能です。 しかし、簡単に保存できる反面、きちんと整理できていないと、該当のデータがどこにあるのか探せなかったり、なくなっていたり、全く使わないデータで容...
人生

人生における幸福について考えてみる

こんにちは、あゆです。 今回は、これまでの記事とは少し異なる記事を書いてみようと思います。 私自身、現在の生き方にいろいろと迷いがあるので、 それを整理する意味でもこの記事を書いています。 人生の意味、目的、生きる意味 多くの人は、一度くら...
IT・プログラミング

迷路で理解する動的計画法と方策反復法

動的計画法とは 動的計画法(Dynamic Programming, DP)は、問題を部分問題に分解して解く手法です。強化学習では、状態ごとに最適な価値を計算し、その情報をもとに最適な方策(Policy)を決定します。特に、エージェントがど...
IT・プログラミング

ベルマン方程式とは?~導出と具体例~

ベルマン方程式は、強化学習や動的計画法で使われる数理モデルで、「最適な行動を選ぶための指針」を提供します。特に、長期的な報酬を最大化するために、各状態で取るべき最適な行動を求めるために利用されます。 ベルマン方程式とは? ベルマン方程式は、...
投資・ファイナンス

Pythonでサクッと仮想通貨データを取得する方法

仮想通貨のデータを取得して分析したいときに、Pythonとオープンソースライブラリ「CCXT」を使えば簡単に取引所からのデータを取得できます。本記事では、仮想通貨取引所「Coincheck」からデータを取得する方法を紹介します。必要なデータ...
IT・プログラミング

強化学習におけるマルコフ決定過程 (MDP) とは?

マルコフ決定過程 (MDP) とは? マルコフ決定過程 (Markov Decision Process, MDP) は、エージェントがある環境内で行動し、最適な行動方針(ポリシー)を見つけるための数学的枠組みです。 特に、強化学習で頻繁に...
IT・プログラミング

強化学習の基本アルゴリズム ε-greedy法

ε-グリーディー法とは ε-グリーディー法(Epsilon-Greedy Method)は、強化学習の代表的な探索アルゴリズムの一つで、探索(exploration)と活用(exploitation)のバランスを取るためのシンプルな手法です...
IT・プログラミング

強化学習の基本問題 バンディット問題とは?

バンディット問題とは バンディット問題 (Multi-Armed Bandit Problem) とは、強化学習の基本的な課題の1つで、限られた資源をどう配分すれば最大の報酬を得られるかを学ぶ問題です。「バンディット」とは、カジノのスロット...