#!/bin/sh unzip -p some.docx word/document.xml | \ sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'