[JM:02615] Re: [POST:DP] bzip2 bzip2.1

Back to archive index
Akihiro Motoki amoto****@gmail*****
2021年 7月 5日 (月) 12:00:35 JST


元木です。

確認ありがとうございます。
コメントがある点だけインラインで。

On Sat, Jul 3, 2021 at 12:29 PM matsuand <michio_matsu****@yahoo*****> wrote:
>
> matsuand です。
> 校正確認、ありがとうございます。
> 以下、長文ですが返信します。
>
> ----- Original Message -----
> > From: Akihiro Motoki <amoto****@gmail*****>
> > To: Linux JM discussion <linux****@lists*****>
> > Cc:
> > Date: 2021/6/24, Thu 23:43
> > Subject: [JM:02541] Re: [POST:DP] bzip2 bzip2.1
> ...
> >> .SH 名前
> >> bzip2, bunzip2 \- ブロックソートによってファイルを圧縮・伸長する。バージョン 1.0.8
> >
> > manpage の見出しのところに「。」が入っているのはあまり見ませんね。
> >   〜を圧縮・伸長する (バージョン 1.0.8)
> > のような書き方もあるかもしれません。
>
> ご指摘どおりです。
> 「〜を圧縮、伸長する (バージョン 1.0.8)」の書き方を採用させて頂きます。
>
> ※ 中黒「・」は好まないので、句点に変えます。

中黒は個人の好みなのでコメントはしませんでしたが、
私も中黒は好きではないので、賛成です。いいですね。

>
> ---
> >> .\"O .SH DESCRIPTION
> >> .\"O .I bzip2
> >> .\"O compresses files using the Burrows-Wheeler block sorting
> >> .\"O text compression algorithm, and Huffman coding.  Compression
> > is
> >> .\"O generally considerably better than that achieved by more
> > conventional
> >> .\"O LZ77/LZ78-based compressors, and approaches the performance
> > of the PPM
> >> .\"O family of statistical compressors.
> >> .SH 説明
> >> \fIbzip2\fP は、Burrows\-Wheeler ブロックソートテキスト圧縮アルゴリズムと Huffman
> > コード化を使ってファイルを圧縮する。
> >> 圧縮率は、一般的な LZ77/LZ78 ベースの圧縮率に比べると、大抵の場合でとても良い。 また、圧縮速度は、統計的圧縮法である PPM
> >> 圧縮の速度に近づいている。
> >
> > Huffman coding は「ハフマン符号化」と呼ぶことが多いと思います。
> > 最後の方に arithmetic coding も出てきますが、こちらも「算術符号化」と呼ぶことが多いです。
>
> ご指摘そのとおりと思いますが、
> 「ハフマン符号 /*化*/」ではなく、「ハフマン符号」でよいと思います。

「ハフマン符号」でいいと思います。
コメントするときに「ハフマン符号化」と「ハフマン符号」とどっちがいいかな、
一般的かな、と迷ったのですが、正直どっちでもよかったです。
code と coding のどちらも「符号」になっていることもあり、
変換作業自体なら「符号化」が適切でしょうが、
ここの文脈では「〜を使う」なので「〜符号を使う」で十分だと思います。

> ---
> >>         filename.bz2    は  filename        になる。
> >>         filename.bz    は  filename        になる。
> >>         filename.tbz2  は  filename.tar    になる。
> >>         filename.tbz    は  filename.tar    になる。
> >>         anyothername    は  anyothername.out になる。
> >
> > 「〜の場合は〜(になる)」などはどうでしょうか。
> > 圧縮ファイルが伸長後のファイルになるわけではなく、
> > あくまで名前の推測ルールを説明しているわけなので。
>
> ご指摘、なんとなくわかります。
> 私はどちらでも良いと感じるので、ご提案採用方向で。
> むしろ私は、各文末の「になる。」の方が気になります。
>
> 再訳として以下のようにしようと思います。
> 「filename.bz2 の場合は  filename」
> (文末の「になる。」を省く)

修正後のものは簡潔で、箇条書きにもマッチした書き方で、よいと思います。

> >> .\"O bzip2 normally declines to decompress files which don't
> > have the
> >> .\"O correct magic header bytes.  If forced (-f), however, it will
> > pass
> >> .\"O such files through unmodified.  This is how GNU gzip behaves.
> >>
> >> 通常 bzip2 は正しいマジックヘッダバイトを持たないファイルを伸長しない。 ただし (\-f)
> > で強制すれば、これらのファイルも修正せずに通過させる。
> >> これは GNU gzip の動作と同じである。
> >
> > (-f) で強制 → (-f で) 強制
>
> 些末ながら「で」には異議あります。
> 「で」という助詞は、数多くの意味があり、常々要注意語と認識しています。
> ご提案訳は、中途半端に感じられます。
> 個人的趣向として助詞「で」は、できる限り用いない文章を考えます。

賛成です。

>
> 再訳
> ただし強制指定 (-f) を行えば、そういったファイルも修正せずに処理する。

原文は pass 〜 through なので、「処理する」よりは元の「通過させる」の方が
意味が近いかなと思ったのですが、どうでしょうか。

> >> .\"O .I bzip2
> >> .\"O usually allocates several megabytes of memory to operate
> >> .\"O in, and then charges all over it in a fairly random fashion.
> > This means
> >> .\"O that performance, both for compressing and decompressing, is
> > largely
> >> .\"O determined by the speed at which your machine can service
> > cache misses.
> >> .\"O Because of this, small changes to the code to reduce the miss
> > rate have
> >> .\"O been observed to give disproportionately large performance
> > improvements.
> >> .\"O I imagine
> >> .\"O .I bzip2
> >> .\"O will perform best on machines with very large caches.
> >>
> >> \fIbzip2\fP は通常、操作のために数メガバイトのメモリを確保し、 とてもランダムな方法で確保されたメモリを変更する。
> >
> > all over it のニュアンスが翻訳に反映されていません。
> > 「〜方法で確保したメモリ全体を変更する」ということを言っているのだと思います。
>
> そもそも charges の訳を「変更」とすることが誤っていると思います。
> 邪推すると changes と読み間違えているのかもしれません。
> 原語の typo ではないと思います。
> 圧縮伸長の両処理過程において、その時々の1かたまりのデータを保持するのに、
> 割り当てたメモリ内をランダムに利用する(charge=充填する)、ということと解釈します。
>
> 再訳
> bzip2 は通常、 数メガバイトのメモリを割り当てて処理を行う。
> そしてそのメモリ全体の利用は、かなりランダムな方法で行われる。

原文の "charges" を見逃していました。ご指摘のとおりだと思います。

最訳へのコメントですが、
そのメモリの全体が利用される、かつ、かなりランダムな方法で利用される、
と言っていると思いますが、「そのメモリ全体の利用は〜」という言い方だと、
後者の方だけ触れていて、前者のニュアンスが少し弱いかなと思いました。
「そのメモリ全体がかなりランダムな方法で利用される」くらいでしょうか。
#もう少し良い案を出せると良かったのですが、、、、


linuxjm-discuss メーリングリストの案内
Back to archive index