logo

Timetable

Timetable
Timetable background1Timetable background3Timetable background3
10:00
Opening
20F #pyconjp_1
Opening Relay
20F #pyconjp_2
Opening Relay
4F #pyconjp_3
Opening Relay
4F #pyconjp_4
10:20
10:20
30min
【招待講演】PythonのUTF-8化
稲田 直哉
日本語
20F #pyconjp_1
10:20
30min
Re:PandasAI:生成AIがデータ分析業務にもたらすパラダイムシフト【増補改訂版】
Ryosuke Tanno
Data Science, AI
日本語
20F #pyconjp_2
10:20
30min
Pythonで 日本語処理 入門 〜フリガナプログラムを作ろう〜
Takanori Suzuki
Data Science, AI
日本語
4F #pyconjp_3
10:20
30min
Streamlining Testing in a Large Python Codebase
Jimmy Lai
DevOps, Testing, Documentation, Packaging
EN
4F #pyconjp_4
11:10
11:10
30min
Cloudflare Workers in Pythonでサーバーレスアプリケーションを作ろう
Ryuji Tsutsui
Web Applications
日本語
20F #pyconjp_1
11:10
30min
データフレームライブラリ徹底比較
桂川大輝
Others
日本語
20F #pyconjp_2
11:10
30min
Pythonの数学機能を学ぼう!その仕組みも学ぼう!
curekoshimizu
Python Features and Development
日本語
4F #pyconjp_3
11:10
30min
Unlocking Python's Core Magic
Wei Lee
Python Features and Development
EN
4F #pyconjp_4
11:40
Lunch Break
20F, 4F Track 1~4
12:40
12:40
30min
実例から学ぶ型ヒントの活用手法
Rei Suyama
Development Practices Using Python
日本語
20F #pyconjp_1
12:40
30min
「巨人の肩の上」で自作ライブラリを作る技術
石原祥太郎
Development Practices Using Python
日本語
20F #pyconjp_2
12:40
30min
Pythonを活用したLLMによる構造的データ生成の手法と実践
柴内一宏
Data Science, AI
日本語
4F #pyconjp_3
12:40
30min
Sleuthing in Cython: Wrapping and Debugging Legacy C Libraries for Python
Maryanne Wachter
Development Practices Using Python
EN
4F #pyconjp_4
13:30
13:30
30min
SQLModel入門 〜クエリと型〜
Mizuki Sato
Web Applications
日本語
20F #pyconjp_1
13:30
30min
Rustを活用したPythonライブラリの開発
Shota Kokado
DevOps, Testing, Documentation, Packaging
日本語
20F #pyconjp_2
13:30
30min
データサイエンスのフルサイクル開発を実現する機械学習パイプライン
Cristian Kamiya
Data Science, AI
日本語
4F #pyconjp_3
13:30
30min
Playing games in the browser with WASM
Neeraj Pandey, Manoj Pandey
Video, Music, Games, Illustration
EN
4F #pyconjp_4
14:20
14:20
30min
実践Dash - 手を抜きながら本気で作るデータ可視化Webアプリの基本と応用
Shinichi Nakagawa(@shinyorke)
Web Applications
日本語
20F #pyconjp_1
14:20
30min
Pythonによるイベントソーシングへの挑戦と現状に対する考察
Masanobu Naruse
Development Practices Using Python
日本語
20F #pyconjp_2
14:20
30min
PythonとOpenCVで楽しむ物体検出!
Lina Katayose
IoT, Hardware, Network
日本語
4F #pyconjp_3
14:20
30min
The Wheelhouse of Horrors
Laszlo Kiss Kollar
Development Practices Using Python
EN
4F #pyconjp_4
14:50
Coffee Break
20F, 4F Track 1~4
15:30
15:30
30min
WEBアプリケーションにおけるAWS Lambdaを用いた大規模な非同期処理の実践
Masataka Okudera
Web Applications
日本語
20F #pyconjp_1
15:30
30min
Pythonと相互運用可能な静的型付け言語Erg
Shunsuke Shibayama
Creating Libraries and Services
日本語
20F #pyconjp_2
15:30
30min
Pythonで3Dモデリングをしてみよう: CadQuery Basic
Hiroshi Sano
Video, Music, Games, Illustration
日本語
4F #pyconjp_3
15:30
30min
Why Knowing Cython Helps in Understanding Python: A Deep Dive into Cython & PVM
Abhik Sarkar
Python Features and Development
EN
4F #pyconjp_4
16:20
16:20
30min
DjangoとFastAPIによる実践認証技術
大島和輝
Web Applications
日本語
20F #pyconjp_1
16:20
30min
Pythonで3次元CGを作りたい人のためのPyVista入門
Tetsuo Koyama
Creating Libraries and Services
日本語
20F #pyconjp_2
16:20
30min
プロダクションでのPython非同期ユースケース - Trio/Trio-Utilを中心に
Junya Fukuda
IoT, Hardware, Network
日本語
4F #pyconjp_3
16:20
30min
Getting Started with Open Source Contributions
Stefanie Molin
Community, Education
EN
4F #pyconjp_4
17:00
17:00
15min
pytest プラグインを開発して DRY に自動テストを書こう
Atsushi Inutsuka
DevOps, Testing, Documentation, Packaging
日本語
4F #pyconjp_3
#pyconjp_3 Relay
4F #pyconjp_4
17:30
Keynote (Atsuo Ishimoto)
20F Track 1~2
Keynote Relay (English)
4F #pyconjp_3
18:25
PyCon JP Association Report
20F Track 1~2
18:40
Closing
20F Track 1~2
Pythonで 日本語処理 入門 〜フリガナプログラムを作ろう〜
Takanori Suzuki
09/28 10:20 - 10:50 (Asia/Tokyo)
4F #pyconjp_3

Pythonでは日本語や英語など、自然言語処理のためのライブラリが豊富に提供されています。このトークでは「日本語の文章に対してフリガナを振る」というプログラムの作成を通じて、Pythonで自然言語処理ライブラリJanomeとSudachiPyを使用した、日本語を処理する方法について解説します。

はじめに自然言語処理とはどういうものか、今回主に使用する形態素解析について概要を説明します。またゴールとする「フリガナを振るプログラム」ではどういう動作をしてほしいかについて最初に説明します。

前半はJanomeを使用してフリガナを振るプログラムを作成していきます。Janomeを使用した形態素解析のやり方、読みの取得、フリガナを振るプログラム作成を行います。その後辞書の改善によるフリガナの改善を行います。

後半はライブラリとしてSudachiPyを使用します。最初にJanomeとSudachiPyの違いに触れ、SudachiPyで書き直す理由について説明します。SudachiPyを使用した形態素解析のやり方、読みの取得、フリガナを振るプログラムを作成します。フリガナの処理をより洗練させ、ユーザー辞書でのフリガナの改善まで行います。また、小学校で学んだ漢字のリストを作成し、小学校で学んだ漢字にはフリガナを振らない処理を作成します。


description
トーク詳細 / Description
  • アジェンダ、ゴール(1m)
  • Who am I?(1m)
  • 自然言語処理とは、形態素解析とは(3m)
    • 形態素解析とは、形態素、用途
  • フリガナプログラムの仕様(2m)
  • Janomeで形態素解析(3m)
    • 特徴
    • インストール
    • 形態素解析を実行
    • 読みを取得
    • 分かち書き
  • Janomeでフリガナ(5m)
    • フリガナを振るプログラムを作成
    • 送りがな対応
    • 辞書をカスタマイズ
    • Janomeの課題
  • SudachiPyで形態素解析(3m)
    • 特徴
    • インストール
    • 形態素解析を実行
    • 読みを取得
    • 分かち書き
  • SudachiPyでフリガナ(7m)
    • フリガナを振るプログラムを作成
    • フリガナ処理の改善
    • 辞書のカスタマイズ、コスト調整
  • フリガナレベル対応(2m)
  • まとめ(2m)

Takanori Suzuki
Takanori Suzuki

Takanori(@takanory) is the Chair of PyCon JP Association and Co-Chair of PyCon JP 2024. He is also a Director of BeProud Inc., and his title is "Python Climber". Currently he teaches Python to beginners as a lecturer at Python Boot Camp all over Japan. In addition, he published several Python books. He plays trumpet, climbs boulder, loves ferrets, beer and Lego.