Categories: 仮説・持論

論文のタブー:データの改ざん

データの改ざんを絶対にやってはいけないという注意喚起のため、このページを作った。
データの改ざんがダメということは、資料をほかの論文からパクってはダメということと同じくらい、
論文を書くときに注意されることの一つだと思う。
だが、実際に、神戸製鋼所が性能データの改ざんを行って、問題となっていので、
改めてデータの改ざんについて考えたいと思う。

スポンサードリンク

数学が他の科目と異なる理由

データの話の前に、まずはデータの原点となる数字(数学)について自分の考えを話そうと思う。
学校で学ぶ基本の五科目の英語、数学、国語、理科、社会の中で、数学だけが他と源流が異なると思っている。
というのは、数学は人が証明したものの上に成り立っている学問であるのに対して、
数学以外はすべて世の中で生じた現象の意味を人間の理解できる形に落とし込む学問だからである。
たとえば、数学は1+1=2を当たり前に使っている。なぜなら、すでに過去に証明されているからである。
これらの証明された式を組み合わせて正解を導いていく。
一方ほかの科目について、
英語や国語は、作品ありきでその著者の考えていた心情や人生を紐解き、
理科の生物は生き物、物理はリンゴが木から落ちる現象を証明し、
社会の歴史や地理はそうなるに至った時間の流れを追及する学問である。
いずれにせよ、言いたいことは、数学以外は世の中の現象、作品を紐解くのに対して、
数学だけが人がすでに証明したものを積み上げるというプロセスが逆の学問である。

データとは誰もが信頼できる指標

前の章で数学が証明されたものの積み上げだという話をした理由は、
今回のテーマであるデータに大きく結びつくからだ。
データは基本的に数値で管理される。
なぜなら、数値や数字は上で話すように証明されたものだけで表現されるからである。
だからこそ、データを数字で記載することで説得力が増えるし、基本的に数値自体を信用する。
逆に考えると、データ(数字)自体を改ざんすることは、その資料の中で一番信用できる部分に嘘があることとなる。
ということは、それ以外の部分はもっと嘘が蔓延していることになってしまうのである。
そのため、論文を書く上でデータの改ざんは絶対にしてはいけないという話につながるのである。
ほかの論理展開をすべて否定することになってしまうのだから。

僕のヒーローアカデミアの100万%

大好きなマンガの僕のヒーローアカデミア(通称ヒロアカ)でも同様のことで叩かれていた記憶がある。
途中まで5%くらいの力に抑えないと体が壊れるヒーローだったのに、
急に100万%で殴るシーンが出てきて意味わからないというコメントがあった。
これも同じような話で、それまでの5%の下りが嘘なのかという話から、
ほかのすべての設定に関して突っ込みをいられるような状況に、
落ちいってしまったのである。
数値は信頼されたものであることが前提であり、
そこで嘘をつくとほかのすべてを疑われるため、扱いには注意したい。

ちなみに、この作者のミスなのは、%表記は基本100%との比較のために使う単位だからである。そのため、100%が誤差になる100万%とは絶対に使わない表現だから違和感しかなく、叩かれたのだ。つまり、2重にミスがあるため完全に信用を落としてしまったのである。

まとめ

最終的に何が言いたいかというと、データや数字は信頼で成り立つため、
そこで嘘をつくとほかのすべてを疑われることに落ちってしまうのである。
論文(学生の場合は就活時のエントリーシートなど)でデータを改ざんすると、
途端に信頼されなくなるため絶対にやめたほうがよい。

トイーク/toyeic

1980年代生まれ。 理系研究職をしながら日々だらだら生活を繰り返してます。 文章力のなさを少しずつ改善するため、ブログを開設しました。

Share
Published by
トイーク/toyeic