プログラミング言語などに対して、人間が一般の意思の疎通に用いる言語。
語順で文意が決定するもの、語形(活用)で文意が決定するもの、その複合があり 多種多様である。
現在数千の言語が知られているが、少数民族に特有の言語などは、その話者が限られるため 次第に失われていく傾向にあり、保護が叫ばれている。
頑張っていた自然言語コンペを断念しました。。 以下反省点3つとその対策を書いていきたいと思います。コンペ初心者は参考にしてくださればこの失敗も浮かばれます。 トランスフォーマーが不慣れでエラー出まくった 最初は本を読んでやっていたんですが、完全初見が実装やるには時間がかかる印象でした。理論背景を押さえるためなら良い本でしたが。機械学習エンジニアのためのTransformers ―最先端の自然言語処理ライブラリによるモデル開発作者:Lewis Tunstall,Leandro von Werra,Thomas WolfオライリージャパンAmazonそこで途中でチュートリアルを見つけたので、メイン…
作業メモ書かないせいでコンペ1個締め切りに間に合わなくなってしまったので備忘録。 メモのテンプレはこちら ch.nicovideo.jp 1. 今日の作業の全体的な進捗度は何点ですか?(「1=非常に不明瞭」から4=「非常に明確」で採点)→2。1. 今日の作業の中で、もっとも重要なことを2つ挙げるなら何ですか?→ labelsの中には複数のラベルが存在する。これらから一意のラベルを生成する必要がある 特徴行列はトークナイズされたカラムをさらに分類器に学習させるのに必要。 1. 上で挙げたふたつの内容を頭のなかで説明してみましょう。その説明にどれぐらい自信が持てますか?(「1=非常に自信がない」か…
本記事では、Azure Machine Learning(以下、AML)のPrompt Flowにある、評価フローの基本的な使い方について解説します。 評価フローを使用することによって、作成したフローの精度評価を簡単に行うことが可能になります。 AML Prompt Flow 評価するフローの準備 接続とランタイムの作成 フローの作成 精度評価に用いるデータセット データセットの作成 データセットのマウント フローの精度評価 設定 バッチ実行 & 精度評価 結果 QnA GPT Similarity Evaluation QnA Ada Similarity Evaluation おわりに A…
私が工学部の情報工学科に入学したのは、1974年のこと。クラスは44名が在籍していて、あれから50年にもなろうというのに何人かで集まることができるのは望外である。何人かは鬼籍に入ったが、比較的早い時期に2/3ほどのメンバーのメルアドが共有できていたので、連絡は容易だった。 もちろん理系のクラスで、数学の得意な学生が多かったが、私ともう一人が作家志望だった。彼とは今でも付き合いがあり、同じくデジタル政策やサイバーセキュリティで議論する立場だ。なぜこの話を思い出したかというと、情報工学がついに文学の領域に入って来たか、文学に情報工学が寄与するようになったから。もちろん、直接的な原因は「生成AI」の…
ジップの法則(Zipf's law)は、統計的な観点から自然言語や他の領域における単語の出現頻度と順位の関係性を表した法則です。この法則は、言語学者であるジョージ・キングズリー・ジップ(George Kingsley Zipf)によって提唱されました。 ジップの法則によれば、あるテキスト(例えば、文章やコーパス)において、単語の頻度が逆順の順位に比例する関係が成り立つとされています。つまり、最も頻出する単語は順位1位であり、2番目に頻出する単語は順位2位であり、n番目に頻出する単語は順位n位というように、単語の出現頻度と順位は逆比例するということです。 具体的に言えば、最も頻出する単語の出現頻…
※本ブログはChatGPTの文章生成機能を活用して執筆しています。 この記事では、ChatGPTとは何か、ChatGPTのこれからについてお話ししたいと思います。 読者ターゲットは、ChatGPTに興味がある皆さまです。では、早速始めましょう。 ChatGPTとは何か ChatGPTのこれから ChatGPTがどのように活用されているのか。 チャットボットとしての活用。 文章生成としての活用。 語学学習支援としての活用。 さいごに ChatGPTとは何か ChatGPTは、OpenAIが開発した自然言語処理技術の一種です。 GPTは、Generative Pre-trained Transfo…
人間とほとんど区別がつかないと話題の自然言語AI「ChatGPT」を試してみました。その機能と性能、現時点で考えうるリスクなどについては、こちらの「テレ東BIZ」の動画が参考になります。www.youtube.com「ChatGPT」に関する私自身のおぼろげな認識では、文章で質問を投げかけると、とても自然な返事が帰ってくるというもので、要するにSiriとかAlexaみたいなものの文章版かなという感じだったのですが、この動画を見るとどうやらそんなところだけに留まるようなものではなさそうです。そのひとつが「要約を作ってくれる」というものです。文章の要約や映像を視聴したうえでの口頭での要約(通訳訓練…
LDAで個人的に良かったサイトまとめました。いや、手抜きじゃないよ笑。 概要 tips-memo.com 原著論文の解説。これでLDAの概要をサクッと把握できる。 さらに深掘り トピックモデルの話 from kogecoo www.slideshare.net LSIとかLDAの前の経緯とかについて書いてくれているスライド。 これで歴史がさらっと学べる。LDAの精度に関しても書かれている。deepage.net 単語をベクトルにするってどういうこと?に答えてくれる良サイト。 コード系 qiita.com これでコードもバッチリ!
こんにちは、技術開発の三浦です。 あっという間に10月になりました。昔の好きな曲の歌詞に「10月の夕暮れ」というフレーズが出てくるのですが、この時期になるとそのフレーズを思い出します。夕方になると、「今日の夕暮れはどんな感じだろう?」って気になる10月です。 インターネットショッピングなどで、他のユーザのレビューを参考にしながら商品を選んだという経験、けっこうあるのではないでしょうか。私はパソコン周辺機器やお菓子などを選ぶとき、レビューを参考にすることが多いです。レビューの文章の中には対象の商品に関する、そのユーザが考える特徴を表す表現が含まれています。この表現をレビューの中から上手く捉えるこ…
自然言語処理において文章分類は一つの重要なタスクである。その際に,各文章に出てくる形態素の数の分布をとることでその文章の特徴として調べる方法があるが,Aさんは,ネット上のいくつかのブログ記事(少なくとも300文字程度はある文章)を分類しようと考え,各ブログ記事のテキストデータをそのままMeCabを用いて形態素に分割し,それぞれのブログ記事において出現回数が最も多かった上位3つの形態素をそれぞれのブログ記事の特徴とした。参考までにMeCabを用いた形態素の分割結果を下記に示す。(/で分割されている) これ/は/、/形態/素/に/MeCab/を/用い/て/分け/た/例/です/。【問題】以下の問に対…
自己紹介 問題にチャレンジ ターゲットマシンを起動します チャットボットを使ってみます プロンプト インジェクション攻撃 AIを活用したセキュリティ対策 まとめ 0-WANについて 一緒に働いて頂ける仲間も募集しています 自己紹介 こんにちは、エーピーコミュニケーションズiTOC事業部 BzD部 0-WANの田中と申します。 弊社でEDR製品を導入いただいたお客様のインシデント調査を主に担当しております。 その傍らプログラマーとしての経験と知識を生かしてセキュリティに関するウェブアプリケーションを設計構築するなどSOCチームのメンバーとして日々サイバーセキュリティと共に在るエンジニアです。 T…
本記事では、Google の AI 言語モデルである Gemini の機能と Cloud SQL のデータ管理機能を組み合わせたツールである Gemini in Database について説明します。 はじめに Gemini in Database とは Database Studio とは Cloud SQL とは Preview 版のサービスに関する注意点 試した手順 Cloud SQL インスタンス・データベースを作成 Gemini in Database を有効にする Cloud SQL Studio へ接続するためのユーザを作成 Cloud SQL Studio へ接続 自然言語でク…
ChatGPTをはじめとする、AIチャット。この背景にあるのがLLMで、日本語では、大規模言語モデルと呼ばれています。どのような仕組みで、テキストの意味を理解して、テキストを生成しているのか。LLMに関する用語を中心に解説します。 LLMとNLP(自然言語処理)の関係 人間が使う言語をコンピュータに理解させるための技術として「NLP(自然言語処理)」があります。 たとえば、日本語や英語などで書かれた文章が与えられたとき、その質問に答えたり、翻訳したり、要約したりすることが該当します。これらの処理をするためには、与えられた文章の文法的な構文を把握しなければなりません。 英語であれば、スペースで区…
タイトル: 「未来を体感する10の革新的なガジェット」 イントロ:テクノロジーの進化は我々の日常生活に革新的な変化をもたらしています。この記事では、未来を体感する10の革新的なガジェットを紹介します。これらのガジェットは、我々の生活をより便利で快適なものにするだけでなく、時には驚きや喜びをもたらします。さあ、未来を垣間見る準備はできていますか? 1. ハイパーリアルなVRヘッドセット近年、仮想現実(VR)技術は驚異的な進化を遂げました。ハイパーリアルなVRヘッドセットは、まるで別世界にいるかのような没入感を提供します。最新のモデルは、より軽量で快適な設計と、リアルな視覚と音響体験を実現する高度…
記事の内容 この記事では、人工知能や認知科学に関するおすすめ本を紹介します。 読み物的な入門書から理論系の本まで、できるだけ幅広く紹介したいです。 色々なテーマの本を読んでいますが、人工知能は理論的にも、実社会的にも、とても面白い話題ですよね。今後も目が離せません。 それでは、目次をどうぞ。 記事の内容 人工知能と認知科学について 認知科学 心と脳 認知科学入門 安西祐一郎 教養としての認知科学 鈴木宏昭 類似と思考 鈴木宏昭 人間の解剖はサルの解剖のための鍵である 認知科学への招待 大津由紀夫 コミュニケーションの認知科学1 言語と身体性 認知科学への招待 苫米地英人 知能の物語 中島秀之 …
こんにちは! 技術部機械学習グループの山口 (@altescy) です。 先月、神戸にて開催された言語処理学会第30回年次大会 (NLP2024)に同じく機械学習グループの深澤 (@fufufukakaka)と共に参加してきました。 昨年に引き続き今年も過去最多の参加者数となり、言語処理研究の盛り上がりを実感しました。 特に去年の年次大会 (NLP2023) のタイミングで GPT-4 が発表されて以降、自然言語処理の研究は大きな転換期を迎えていると感じます。 大規模言語モデル (LLM) が研究の主流となる中、どんな課題や発見があるのか、期待をもって参加する大会となりました。 この記事では …
AI副業の世界へようこそ。 このガイドでは、AI技術を活用した副業の可能性について探求し、その魅力と挑戦、そして成功への道を解き明かします。 AIの進化は止まることを知らず、その波に乗ることで、あなたも新たなキャリアの地平を開くことができます。 では、未来への一歩を踏み出しましょう。
AI(人工知能)はプログラミングをより効率的にするための革新的なツールとして急速に進化しています。AIは、プログラミングプロセスのさまざまな側面で開発者を支援します。 Tabnine「Tabnine」は、プログラミングにおける自動補完ツールの1つです。通常、プログラミング中にコードを入力する際に、関数や変数の名前、メソッド、クラスなどを入力しなければなりませんが、Tabnineはこの作業を効率化するために開発されました。機械学習を利用して、プログラマーが入力しているコードのコンテキストに基づいて、次に入力される可能性の高いコードの一部を予測します。これにより、開発者はコードをより迅速に入力し、…
こんにちは、igaです。 最近は気温の上下が大きいので、服装選びが大変ですね。 今回は、Azure OpenAI Servce Assistants APIを使ってみました。 Azure OpenAI Servce Assistants APIに横浜市の人口データを投入して、人口の増減がどう推移しているのか自動で分析させてみました。 Azure OpenAI Servce Assistants API Azure OpenAI Servce Assistants APIとは Azure OpenAI Servce Assistants APIは、2024年4月現在パブリックプレビューとして利用…
世界的課題である創薬ターゲットの枯渇 国も期待するAI創薬 ライフサイエンスのための産学AIコンソーシアム AI創薬に欠かせない研究者の勘 人の知恵:問いかけとデータ 揺らぐ自然言語をAI可読にするという課題 一つのプロジェクトの実現には、複数のAI サイエンスは国民のしあわせのために 取材協力 近年、薬の開発にAIを活用する、AI創薬の進化が凄まじい。創薬には長い時間と莫大な費用を要するが、AIを活用することで時間の短縮やコストカットにもつながる。各製薬メーカーが開発にしのぎを削る中、国立研究開発法人医薬基盤・健康・栄養研究所(以下、医薬健栄研)AI健康・医薬センター上席研究員として、日本の…
こんにちは、開発部モバイルアプリチームの小関です。 普段は求人飲食店ドットコムのiOS・Androidアプリの開発をしている私ですが、昨年4月に設立された「GPTプロジェクトチーム」にも参加しており、この1年でより一般的にも身近になってきた生成AIをサービスや普段の業務に使えないかと模索する仕事もする日々です。 今回は、そんな「GPTプロジェクト」の一環で作成した社内アシスタントBotによって、ナレッジの検索しづらさを解決しようとした事例をご紹介しようと思います。 GPTプロジェクトとは 弊社では2023年4月から、CTO直下に「GPTプロジェクトチーム」を新設して(*1)、ChatGPTのよ…
たつきち インターネットに載せたい情報はブログに書いて、載せたくない情報はobsidianに書くことについてどう思いますか 某AI ブログとObsidianの使い分け: 情報共有の最適化 インターネットに公開する情報とそうでない情報を整理し、それぞれに最適なツールを活用することは、情報管理と共有において非常に重要です。ブログとObsidianは、それぞれ異なる強みと弱みを持つツールであり、状況に応じて使い分けることで、情報の整理と共有を効率化することができます。 ブログ: 長所: 広い範囲の人々に情報を公開できる 検索エンジンからの流入を獲得しやすい 読者との交流やフィードバックを得やすい 文…
原理的にITテクノロジーはアメリカが有利にできている。 TwitterやAmazonやFaceBookには新規性もなければ、特殊なテクノロジーも使われていない。誰でもできることだ。しかし、こういったプラットフォームは英語圏でないとまず無理なのだ。 ついでいえば、プログラミングというのはコモディティの極致のようなもので、誰が作ってもまあ大差ない。 半世紀前なら天才プログラマーもありえたが、今はどうでもいい。マシンパワーと膨大なライブラリとサンプルコードがすべてを解決してくれる(まあ99.9%の話で、0.1%の分野では天才が必須。AIとかね)。 ITテクノロジーに幻想を抱きすぎているきらいが、世間…
hapicom Inc.ことハッピーコンピューター株式会社では、様々な業界におけるご相談やご依頼の中で「一筋縄ではいかない問題」に直面することが多々あります。 本シリーズでは、過去にあった一筋縄ではいかない問題について、公開できる範囲でストーリー仕立てにしてご紹介していきます。 あまりオープンな場ではみられないような案件が多いので、こんな世界もあるのかと楽しんで読んでいただければ幸いです。 地獄の黒塗り作業から解放せよ!問題編 地獄の黒塗り作業から解放せよ!解決編 方法の模索 検証と実践 指摘と修正 地獄の黒塗り作業から解放せよ!後日談 (付録)PDF文書に黒塗りするコード 地獄の黒塗り作業か…
キングオブマネーメーカー 文章力がなくても大丈夫!AIが作る魅力的な記事の秘密とは?現代の情報社会において、魅力的な記事は重要な存在となっています。しかし、文章力に自信がない人にとっては、そんな魅力的な記事を作ることは容易ではありません。しかし、AIが登場したことで、その難しさを解消する道が開けました。では、AIが作る魅力的な記事の秘密とは一体何なのでしょうか?本記事では、その秘密に迫ります。AIが人間の文章力を超えることができる理由や、魅力的な記事を作る方法について具体的に解説していきます。文章力に自信のない方にとって、AIは頼もしいパートナーとなることでしょう。では、さっそくその秘密に迫っ…