ものづくり:続・次のネタ
- Dancing Shigeko

- 4 日前
- 読了時間: 2分
こんにちは、Dancing Shigekoです!
連続投稿機能を実現して、iMacの方で夜な夜な作業をすることを考えてみる。
やりたいことは、ドラマまとめページにリストアップされているドラマを一つずつピックアップ。
そして関連記事を紐付けしていく処理。
この処理を作ったら、今度はタイトルの体裁を整える自動化ツールを作ってみようか。
いざ作業をしようと考え始めると、不思議と自動化の案件が出てくるものである。
試しに聞いてみたらこんな回答。
----
あります。実装方針としては素直で、今のスクリプトにも載せやすいです。
方法は 2 段階です。
まとめ 記事を開いて、本文中の各話タイトルリンクを取得する
取得したタイトルをリスト化して、今の wix_related_flow_step1.py の処理を順番に回す
現実的な構成はこの2案です。
まとめ記事URLを入力して、その記事内のリンク一覧を拾う
国内ドラマまとめ や 海外ドラマまとめ を開く
本文中の 第1話, 第2話, ... のリンクテキストやURLを取得
リンク先タイトルを正規化して配列化
その配列を target_titles として既存処理に流す
まとめ記事の本文テキストから各話タイトルを抽出する
リンクでなくても、本文に各話タイトル一覧が並んでいれば抽出可能
ただし、リンク取得のほうが精度は高いです
おすすめは 1 です。理由は、まとめ記事に載っている順番をそのまま使えて、作品ごとの対象範囲も明確だからです。
実装イメージはこうです。
新しい引数を追加: --summary-title または --summary-url
そのまとめ記事を開く関数を追加
本文の各話リンクを収集して list[str] を返す
既存の target_titles 生成部分を差し替える
つまり、
今: --post-title で一覧検索してタイトル収集
変更後: まとめ記事 からタイトル収集して、そのリストを順次処理
必要なら次にその機能をそのまま実装します。おすすめは --summary-title "国内ドラマ『作品名』まとめ" を渡して動かす形です。
---
どうもちょっと違うような気がする。
もう少し吟味してみよう。
それでは、また明日!
コメント