ブログ · 2024/05/22

研究公正を推進するツール iThenticate（アイセンティケイト）とは | ターンイットイン

The Turnitin Team

Laura Young

Content Marketing Specialist

サブスクライブ

名前 *

電子メール *

言語の好み *

同感だ *

このフォームに記入することにより Turnitin のプライバシーポリシーポリシーに同意するものとします。Turnitin は以下の目的で提供された情報をお客様に関連する情報を提供します。お客様はこれらのいつでも解除することができます。いつでも解除することができます。

1990年代、ターンイットインはインターネットを通じた手軽な盗用・剽窃が増加したことに対抗する新たなツールとして最初の注目を集めました。それから数十年、今では世界中の教員や教育機関のためのインテグリティソリューションとして知られています。

しかし、盗用・剽窃は教室の中だけにかぎりません。そのような認識のもとで、研究者や出版社、学術やビジネスのリーダー、入試担当者、政府関係者らも使える、優れた研究を守るための専門ツール、iThenticateが登場しました。

モハーら（2020）は、「知識が研究や社会に利益をもたらすには、それが信頼に足るものでなければならない」と説明します。iThenticateの考え抜かれた設計により、研究者がオリジナルの原稿を提出でき、出版社は倫理にのっとった論文を出版していると確証をもてるようなります。では、iThenticateはそのような確証をどのように提供するのでしょうか。本記事では、iThenticateについて詳しく説明し、2004年以来、研究コミュニティの頼もしい味方となってきた理由を紹介します。

iThenticateは盗用・剽窃をチェックするのか？

類似性レポートは盗用・剽窃を検知するツールであると誤解されがちです。教育コミュニティの間で広まるその誤解を解くことこそ、教育機関において私たちのソリューションを公正かつ正しく活用していただく鍵となります。

類似性レポートは、ターンイットインのデータベースと照合して一致するテキストを検知する、テキストマッチングソフトウェアです。データベースのソースと類似あるいは一致するテキストを見つけると、あとからレビューできるように類似性レポートでフラグが立てます。

「類似」＝「盗用・剽窃」ではありません。ターンイットインのデータベースと完全に一致する学術文章があっても、それはまったく普通のことです。引用や参照は、既存の研究成果を説明し、その知見をさらに押し広げるものであるため、一般的に許容されています。類似性レポートで出典を徹底的に調べて、当該のテキスト一致が許容範囲内かを判断することが大切です。許容できるテキスト一致かどうかは人間の解釈に頼るしかありません。類似性レポートだけから全体像をつかもうとするのではなく、もっと広範な調査をするためのパズルの1ピースとして類似性レポートを活用することをお勧めします。

類似性レポートの解釈の仕方について知る

iThenticateの類似性レポートは研究不正の抑止にどう役立つのか？

研究者や出版社、学者がiThenticateを使用する目的はそれぞれ異なるかもしれませんが、そのプロセスに関わる全員に共通する最終目標は、研究公正を推進することでしょう。その目標達成に一歩近づくためにiThenticateの類似性レポートが役立ちます。

類似性レポートは、よく知られている類似性スコアから、一致箇所のハイライト表示、フィルタリング機能まで、数多くの機能を柔軟に使えるドキュメントです。これらの機能を活用することでテキスト一致の原因を特定し、原稿の矛盾点を突き止めることができます。

マカロックとベーレント、ブライスウェイト（2021）の研究では、学生119名と指導者26名を対象にiThenticateのさまざまな使用方法を調べ、「両グループにとって、盗用・剽窃（意図的なものであれ、偶発的なものであれ）を防止するというiThenticateの規制的な機能が重要である一方で、研究論文の執筆力を向上させ、論文の出版につなげるというiThenticateの潜在的な教育機能も同様に重要である」ことが明らかになりました。

類似性レポートは、オリジナルでない文章や引用の不備を特定するために作られた強力なツールですが、改良を重ねるうちに、アカデミック・インテグリティを促進する貴重なツールにもなってきました。iThenticate 2.0で利用可能な新たな類似性レポートでは、従来の類似性を検知する機能に加えて、インテグリティに関するさらなる知見を提供します。新たな類似性レポートでは、研究者は盗用・剽窃を特定するだけでなく、研究論文の執筆において許容されることとされないことを学ぶことができます。ターンイットインでは、ユーザーエクスペリエンスとは単なる概念ではなく、実際の感覚であると考えています。iThenticate上のすべてのインタラクションをポジティブかつシームレスにするための全力で取り組んでいます。

AI生成文章の可能性を特定する

2023年4月、ターンイットインのAIライティング検知機能が当社の多くのインテグリティ製品で使用できるようになりました。これは、ChatGPTのようなAIライティングツールの不適切な使用に対処するうえで重要な一歩となりました。iThenticateにAIライティング検知が組み込まれたことで、研究者や出版社、学者は研究や出版に際して、この新たな形の不正から身を守ることができるようになりました。

生成AIの複雑さにより、AIライティングを手作業で特定することが難しくなっています。ターンイットインでは、AI生成コンテンツのチェックに要する労力を最小化し、研究者や出版社の負担を軽減することを目指しています。iThenticateの類似性レポートでターンイットインのAIライティング検知ツールを活用すると、論文を一括チェックできるため、従来の大変な出版プロセスを全体的に効率化できます。

他方で、AIライティング検知においてテクノロジーは全体の一部に過ぎず、それだけでは不十分です。忘れてはならないのは、「皆が人工的に作られた未来へ進むにつれて、人間ならではの探求心が必要になることは明らかだ。事実、私たちの調査能力や批判的思考力がこれまで以上に求められるようになるだろう」（オブライエン、2023）ということです。

ターンイットインではパートナーの出版社に対して、著者のAIライティングスコアを広範な調査要素の一部と見なすように提案しています。AIライティング検知ツールはAI利用の可能性を示しますが、決定的な判断をくだすことはできません。投稿論文の中にAI生成コンテンツが含まれていないか探す際には、誤検知や意図性、著者の既知の能力を考慮して、人間の解釈を優先することを推奨します。研究コミュニティのために作られたiThenticate 2.0では、生き生きとした現代的なインターフェースにより、最初の草稿段階から最終段階での類似性チェックまでをスムーズにナビゲートします。新しくなったiThenticateのインターフェースは一貫性があり、初めてのユーザーでもすぐに使いこなせるように熟慮を重ねて作られています。また、iThenticate 2.0はアクセシビリティ基準にも適合しており、教育コミュニティの包括性の向上に寄与します。

テキスト操作を検知して不正行為を発見する

類似性レポートの新機能としてフラッグパネルが追加され、置換文字や隠し文字といったテキスト操作も検知できるようになりました。ターンイットインのアルゴリズムが通常の提出物と異なる点がないかを深く調査し、不審な点があればレビューのためのフラグを立てます。必ずしもフラグが問題を示すわけではありませんが、注意してレビューすることをお勧めします。

隠し文字や置換文字は、除外機能を悪用したり、類似性レポートの類似性チェックを妨害したりするために意図的に実施されることがあります。通常、このような回避策は単純な引用ミスよりも計算されたものであると見なされ、出版社が投稿論文を審査する際に不正行為の意図性を判断するのに役立ちます。

テキストの一致結果をカテゴライズして意図性を判断する

以前、当ブログで、自己盗用・自己剽窃についてと、過去の出版済みの論文を適切に引用することの重要性について議論しました。自分の成果の再利用は、適切に引用し、出典がきちんと示されていれば一般的に許されます。しかし、それらの詳細情報が欠落するとどうなるのでしょうか。

意図せぬ盗用・剽窃は、教育のあらゆる段階で（たとえ大学院レベルであっても）学生の成長の機会となります。しかし、データと洞察の収集は長らく困難であったため、出版社が学術不正の意図性を見極めるのが難しくなっていました。

iThenticateの類似性レポートでは、引用ミスと意図的な省略を見分けるのが簡単になります。テキストの一致結果は、引用符の使用や出典の記載に応じて次の4つのカテゴリーに分類されています。
・引用符および出典の明記なし：一致したテキストに引用符がなく、出典も明記されていない。盗用・剽窃の可能性があり、さらなる調査を要する。
・引用符なし：出典は示されているが、テキストの一致率が高いため、引用符が必要かもしれない。
・出典なし：一致したテキストは引用符付きで引用されているが、出典が明記されていない。
・引用符および出典あり：一致したテキストは引用符つきで引用されており、出典も明記されている。

引用や参照できる情報があふれる現代では、テキストの一致結果を以上のようにカテゴライズすることで、その解釈や分類がずっと容易になり、意図的な不正か、改善の余地のある原稿か、あるいは基準を満たした論文かを素早く見極めるのに役立ちます。

ターンイットインは、データコンプライアンスについて研究コミュニティが抱える懸念を理解し、当社に転送されるすべてのデータを安全性の高いAWSプラットフォーム上で保存しています。アメリカとヨーロッパ、アジア太平洋地域にデータセンターがあり、iThenticate 2.0にアップロードされたすべての個人情報は安全に保護され、世界最高の基準に従って保存および処理されていることを保証します。

ターンイットインでは常にテクノロジーを更新し、迅速に機能を提供するための盤石な基礎を築いています。当社の最先端のテクノロジーを用いた最新のツールで、教育機関のイノベーションを加速化するお手伝いをいたします。iThenticate 2.0は、出版に関わるすべての人々の効率化を図る第一歩であると捉えています。

グループごとのテキスト一致のデモを見る

ダイナミックな除外機能で類似性スコアの精度を上げる

iThenticateの除外機能は、研究者や出版社、学者がオリジナルの文章として提出されたテキストのみをターンイットインのデータベースと照合したい場合に役立ちます。iThenticateの除外機能を活用すると、類似性レポートをさらに洗練し、類似性スコアの精度を上げることができます。提出物の類似性レポートからは以下のアイテムを除外できます。

・ビブリオグラフィー（書誌情報）：冒頭および終わりの特定のフレーズから特定
・引用符：特定の引用符から特定
・引用：本文での引用および参考文献から特定
・小さな一致：数値やパーセンテージで決定
・プレプリントソース：プレプリントリポジトリを手動で追加することも可能
・特定のコンテンツデータベース：インターネット、出版物、提出物、プライベートリポジトリを含む

iThenticateの設定を変更してさまざまな種類の資料を類似性レポートから除外することで、研究者は各論文の類似性スコアがオリジナルの文章として提出されたコンテンツだけを対象としていると確信を得られます。また、この除外機能は、質的分析と量的分析など異なるタイプの研究をしている研究者や学者が公正に競争できる環境づくりにも寄与します。

iThenticateは著者同士の共謀をいかに暴くのか？

関連性の高い機関や業界のコンテンツにアクセスできることは、学術機関にとって、重大な論文が投稿される前に盗用・剽窃の可能性を徹底的にチェックするために非常に重要です。チェックすべき不正行為には、学術機関内や研究者間の共謀も含まれています。

「インターネットのユビキタス性やパブリッシュ・オア・ペリッシュ（出版か死か）の要求の高まり、そしておそらく、“悪い”剽窃や共謀とは何かについての認識の変化……学術論文の執筆者や学術誌の編集者が、この分野全体をどのように見なし、どのように対処するか考えるべき時期に到達しているのかもしれない」（サイクス、 2009）。

ターンイットインは出版社が自社の評判を守り、自信をもって論文を出版できるよう支援したいと思っています。現在、iThenticate 2.0のライセンスに標準で含まれる機能により、学術機関は著者にプライベートリポジトリの独占使用を認めることができます。

出版社は、ターンイットインの広範なデータベースにアクセスし、iThenticate内で盗用・剽窃の検知ができます。また、自社が扱うジャーナルすべての過去の投稿論文をチェックできるため、著者間の共謀を発見することもできます。

出版社独自のプライベートリポジトリと照合することで、外部ソースと混ざることなく自社のリポジトリに含まれる論文だけを中心に、密度の高い類似性レポートを作成することができます。

iThenticateはどのようにして、出版済みの論文や未出版の論文で自己盗用・自己剽窃を防ぐのか？

盗用・剽窃の最も分かりやすい形は他者の成果を自分のものとして利用することですが、自己盗用・自己剽窃（テキストの再利用とも言う）も同様に研究公正の価値を脅かすことがあります。自己盗用・自己剽窃とは、著者が過去に発表した自分のコンテンツを再利用し、引用などで出典を明確に示すことなく、「新たな成果」として発表することを指します。

米国研究公正局は、「盗用・剽窃が窃盗として捉えられていることを考えると、盗用・剽窃の概念はあまり意味をなさないように思われる。結局、自分から盗むことは可能なのだろうか？」と示唆に富む疑問を呈しています。では、自己盗用・自己剽窃はなぜ倫理に反するのでしょうか。自己盗用・自己剽窃は比較的無害なタイプの盗用・剽窃と考えられていますが、それでも、「新たな情報が提示されているかのようにほのめかし、読者を欺こうとする意図的な試み」であることに違いありません（ボーネル他、 2012）。

意図性の有無に関わらず、自己盗用・自己剽窃は研究コミュニティ内での評判やインパクトファクターに長期的な影響を与える可能性があります。発表された論文と、同一著者の過去の出版物との間に重大な重複が認められると、ジャーナル編集者が論文撤回記事の掲載を検討するかもしれません。出版社からコンテンツ再利用の許可を得ていない場合、著作権侵害の恐れもあります。

iThenticateのドキュメント比較機能とは？

ターンイットインでは、盗用・剽窃チェックよりも、盗用・剽窃の抑止と軽減を重視しています。iThenticateには研究論文の著者が最高の結果を出すために必要な機能が搭載されています。出版社へ原稿を提出する前に、iThenticateのドキュメント比較機能を用いて、コンテンツ重複のリスクを回避しましょう。

iThenticateのドキュメント比較機能を使うと、著者は未発表の原稿のサブセットと投稿予定の原稿とを比較して比較レポートを作成できます。そうすることで、投稿前の文章についても、将来学術誌に投稿した際に類似性レポートでテキスト一致を指摘されることがないと自信をもてます。

方法論や研究動機が類似した複数の論文を投稿する予定がある場合にも、未発表の文章との比較は有益です。それらの原稿の内容や焦点が大きく異なっていても、方法論や研究動機のテキストが再利用されていると、iThenticateの類似性レポートでフラグを立てられる可能性があります。もちろん、発表済みの文章を再利用することに倫理的な正当性を見いだしている場合は、関係者全員の同意を得て、既存の出版物を利用したことを新しい論文内で明記することが重要です（イスラエル、2019）。

方法論やプロトコルの再利用に関するガイドラインは頻繁に変わります。キャスリーン・オグレイディの記事によると、医学雑誌『Anesthesiology（麻酔学）』の編集長、エバン・カラシュは、著者が元の論文を引用するのであれば、当誌では過去の出版物と同一または極めて類似した方法論を認めるようになったことを示し、「自分たちの研究手法について最高の記述を活用できるようにすることは理にかなっていると考えた」と述べました。

また、ドキュメント比較機能は、すべての共著者の貢献が適切に明記されているかを出版社が論文出版前に確認するのにも役立ちます。

まとめ：iThenticateで研究公正を推進する

際限なく知識を共有できる時代のなかで、ターンイットインは研究コミュニティと連携して、英国研究公正局が定める「誠実性」「透明性」「厳密性」「敬意」「説明責任」の価値を強化します。

iThenticateとその考え抜いて設計された諸機能を活用すると、研究者や出版社、学者が研究公正を守り、出版プロセスに関わるすべての人々が確固たる責任をもって情報の普及に携われるようになります。

iThenticateについて