id:Kodakana
文字列操作メモのことを語る

HTML や XML からタグを除去して要素の内容を取り出す。
sed -e "s/<[^>]*>//g" sourcefile.html