実習・Pythonによる業務効率化テクニック入門《PDF操作編》【オンライン限定セミナ】
実習・Pythonによる業務効率化テクニック入門《PDF操作編》【オンライン限定セミナ】
|
|
【開催日】2024年9月29日(日) 10:00-17:00 1日コース
【セミナNo.】ES24-0092 【受講料】27,500円(税込)
【会場】オンライン限定セミナ
【セミナNo.】ES24-0092 【受講料】27,500円(税込)
【会場】オンライン限定セミナ
※本セミナはZoom,またはTeamsを使ったオンライン限定セミナです.
詳細は,オンライン限定セミナについてをお読みください.
今日では,さまざまなビジネスシーンで利用されていて,もはやその存在を知らない人はいないくらいに普及しているPDF.エクセルやワード,パワーポイントなどのオフィスソフトで作成したドキュメントや画像ファイルを配布するときに,改変防止,サイズ軽量化や閲覧プラットフォーム(OS)依存性回避等の目的で “PDF化”することが多い.
その一方で,逆にPDFからテキスト成分や画像データ成分を取り出す必要が生じる場合も,社会保険関連や会計関係などのドキュメント整理・集計業務では多々発生する.そのためには,Adobe Acrobatのような有償ソフトを使用することでPDF内の各データの取り出しや編集はできるが,幾ばくかの初期導入コストがかかり,また数百のファイルを一括で扱いたい場合は,手作業では「多大な工数≒人件費」もかかる.
そこで,本セミナではPythonを利用して,コストのかからないODF操作間接業務の生産性向上効率化・自動化テクニックと必要な知識とそのデスクトップアプリ化を実践的に紹介する.
※本セミナテキストのPDFファイル配布について
下記事項に同意して頂ける受講申込の方には,テキストのPDFファイルを配布いたしますので,メールでご連絡ください.
必要となる同意事項:有償無償問わず研修会/講習会/セミナ等での使用や再配布は行わない(ただし,条件,状況等により応相談)
詳細は,オンライン限定セミナについてをお読みください.
今日では,さまざまなビジネスシーンで利用されていて,もはやその存在を知らない人はいないくらいに普及しているPDF.エクセルやワード,パワーポイントなどのオフィスソフトで作成したドキュメントや画像ファイルを配布するときに,改変防止,サイズ軽量化や閲覧プラットフォーム(OS)依存性回避等の目的で “PDF化”することが多い.
その一方で,逆にPDFからテキスト成分や画像データ成分を取り出す必要が生じる場合も,社会保険関連や会計関係などのドキュメント整理・集計業務では多々発生する.そのためには,Adobe Acrobatのような有償ソフトを使用することでPDF内の各データの取り出しや編集はできるが,幾ばくかの初期導入コストがかかり,また数百のファイルを一括で扱いたい場合は,手作業では「多大な工数≒人件費」もかかる.
そこで,本セミナではPythonを利用して,コストのかからないODF操作間接業務の生産性向上効率化・自動化テクニックと必要な知識とそのデスクトップアプリ化を実践的に紹介する.
※本セミナテキストのPDFファイル配布について
下記事項に同意して頂ける受講申込の方には,テキストのPDFファイルを配布いたしますので,メールでご連絡ください.
必要となる同意事項:有償無償問わず研修会/講習会/セミナ等での使用や再配布は行わない(ただし,条件,状況等により応相談)
● 対象聴講者
・PDFの操作(編集,データ取り出し)に興味のある方
・電子書類の整理業務を効率化自動化したい方
・Pythonの実務での活用に興味がある方
・PDFの仕組み詳細を知りたい方
● 講演の目標
・PDFデータ抜き取り方法を理解できる
・PDFの連続ページ画像ファイル化を理解できる
・PDF操作に必要なPythonライブラリの利用方法がわかる
● 内容
1. 基本事項:PDFって何者?
用途目的
内部構造概略
弱点,デメリット
2. 操作するために必要な基礎知識・注意点
Tesseract,Pyocr
Poppler,pdf2image
Pdfminer
Pandas
3. 参考:Google Cloud Vision API
概要,機能
4. ライブラリインストール,利用環境整備
5. PDFテキスト成分の画像ファイル化をしてみよう!
6. PDFテキスト成分の抽出をしてみよう!
7. PDF画像成分の文字認識抽出をしてみよう!
8. PDFを修正して保存してみよう!
9. まとめ
10. 総合自由演習&フリーQ&A
PDFページJPEGファイル連続変換処理のデスクトップアプリ化
複数PDFを結合して必要情報を抽出リスト化してエクセル保存する処理をデスクトップアプリ化
結合前のPDF1
ダウンロード(Exa.pdf)
結合前のPDF2
ダウンロード(Exb.pdf)
結合後のPDF
ダウンロード(Merge.pdf)
必要情報を抽出リスト化したエクセルファイル
ダウンロード(List.xlsx)
・PDFの操作(編集,データ取り出し)に興味のある方
・電子書類の整理業務を効率化自動化したい方
・Pythonの実務での活用に興味がある方
・PDFの仕組み詳細を知りたい方
● 講演の目標
・PDFデータ抜き取り方法を理解できる
・PDFの連続ページ画像ファイル化を理解できる
・PDF操作に必要なPythonライブラリの利用方法がわかる
● 内容
1. 基本事項:PDFって何者?
用途目的
内部構造概略
弱点,デメリット
2. 操作するために必要な基礎知識・注意点
Tesseract,Pyocr
Poppler,pdf2image
Pdfminer
Pandas
3. 参考:Google Cloud Vision API
概要,機能
4. ライブラリインストール,利用環境整備
5. PDFテキスト成分の画像ファイル化をしてみよう!
6. PDFテキスト成分の抽出をしてみよう!
7. PDF画像成分の文字認識抽出をしてみよう!
8. PDFを修正して保存してみよう!
9. まとめ
10. 総合自由演習&フリーQ&A
PDFページJPEGファイル連続変換処理のデスクトップアプリ化
複数PDFを結合して必要情報を抽出リスト化してエクセル保存する処理をデスクトップアプリ化
結合前のPDF1
ダウンロード(Exa.pdf)
結合前のPDF2
ダウンロード(Exb.pdf)
結合後のPDF
ダウンロード(Merge.pdf)
必要情報を抽出リスト化したエクセルファイル
ダウンロード(List.xlsx)
【受講者が持参するもの】
・インターネットにアクセス可能なWindows 10/11 PC
・Python実行環境(Python3.12.2+VSCode).構築方法は事前にメールで連絡いたします.
・筆記用具(任意)
※実習なしで聴講だけならタブレットやスマフォでも可(非推奨)
・インターネットにアクセス可能なWindows 10/11 PC
・Python実行環境(Python3.12.2+VSCode).構築方法は事前にメールで連絡いたします.
・筆記用具(任意)
※実習なしで聴講だけならタブレットやスマフォでも可(非推奨)
【講師】
早乙女 勝昭 氏〔 元FPGAエバンジェリスト〕
FPGAマガジンなどFPGA関連記事執筆やセミナ開催多数
『FPGAマガジン No.6 カメラ×画像処理×FPGA』,CQ出版社,2014年7月.
『FPGAマガジン No.10 やっぱり楽ちん!C言語×FPGA』,CQ出版社,2015年7月.
実習・直伝!最新FPGAを使ったビデオ・システムの開発(プラット・フォーム構築編)
等々
病気療養生活から復帰後はPythonやGAS(JavaScript)やExcel VBAなどのスクリプト言語を活用して,社会保険関係書類の整理・作成効率化に従事.現在クラウド・インフラエンジニアリングにも注力
早乙女 勝昭 氏〔 元FPGAエバンジェリスト〕
FPGAマガジンなどFPGA関連記事執筆やセミナ開催多数
『FPGAマガジン No.6 カメラ×画像処理×FPGA』,CQ出版社,2014年7月.
『FPGAマガジン No.10 やっぱり楽ちん!C言語×FPGA』,CQ出版社,2015年7月.
実習・直伝!最新FPGAを使ったビデオ・システムの開発(プラット・フォーム構築編)
等々
病気療養生活から復帰後はPythonやGAS(JavaScript)やExcel VBAなどのスクリプト言語を活用して,社会保険関係書類の整理・作成効率化に従事.現在クラウド・インフラエンジニアリングにも注力