NLP

ChatGPTに、任意の文章中に指定単語の含有数をカウントし、出力するPythonモジュールを書いてもらった

ChatGPTに、任意の文章に対して指定した単語がいくつ含まれるかをカウントして、結果を出力するPythonモジュールを書いてもらいました。 指示文(プロンプト): 以下の仕様に沿ったPythonモジュールを書いてほしいです。 仕様:入力したテキストを形態素解析し…

ChatGPT_APIで任意のテキストを短くしたり長くするPythonコード

ChatGPTのAPIを利用して、任意のテキストを短くしたり長くするPythonコードです。 APIに投げるprompt部分をもう少し詳細に指定するようにすれば、どのくらいの短さ(長さ)にするかも制御できるかもしれません。 import openai def convert_to_short(prompt): …

ChatGPT_APIで任意のテキストを敬体・常体変換させるためのPythonコード

ChatGPTに敬体・常体を変換するPythonコードを書いてもらいました。 最初に提示されたのはシンプルな置換ルールを定義するもので、実用には堪えません。 敬体・常体変換・統一を高い精度で行う良いライブラリも見当たらず、現時点では自力で機械学習などで厳…

ChatGPTに、htmlファイルから指定タグ内のテキストだけを抽出するPythonコードを書いてもらった

ChatGPTに、htmlファイルから指定タグ内のテキストだけを抽出するPythonコードを書いてもらいました。自然言語処理やスクレイピングでよくある前処理の一つですね。 今回は青空文庫でダウンロードしてきたhtmlファイルから本文だけを取得したい場合です。 指…

ChatGPTに、二つの文章の類似度を判定してもらうPythonプログラムを書いてもらった

ChatGPTに、二つの文章の類似度を判定してもらうPythonプログラムを書いてもらいました。最初の指示だとあまり使えないコードが出力されたので、そのあとに改良版として少し具体的に指示した結果ものせてます。 指示文(プロンプト)1: 二つの文章の類似度を判…

ChatGPTにレーベンシュタイン距離を調べるPythonコードを書いてもらった

ChatGPTにレーベンシュタイン距離を調べるPythonコードを書いてもらいました。レーベンシュタイン距離というのは、2つの文字列がどの程度異なっているかを示すものです。例えば、「カナダ」と「サナダ」と一文字違いなので、レーベンシュタイン距離は1となり…