Frequently-asked questions about EMPIAR

EMDBとEMPIARの違いは何ですか?

単粒子実験、電子線トモグラフィー実験、電子線回折実験からの最終的な3次元再構成をEMDBに提供することができます。 EMDBに登録された画像データ(顕微鏡写真、粒子スタック、チルトシリーズなど)は、EMPIARに登録することができます。 EMPIARは、以下の実験手法もサポートしています(画像データおよび最終的な再構成が可能な場合はそれを使用)。

  • 3D Scanning Electron Microscopy (3DSEM)
  • Soft X-ray Tomography (SXT)
  • 2D EM image data from integrative/hybrid modelling experiments

これらの実験的手法では、データセットが出版物に直接関連するものであるか、あるいはベンチマークデータなどコミュニティの取り組みの一部であることが要求されます。

ダウンロードの方法を教えてください

  • データのダウンロードは、Webインターフェイスか、コマンドラインインターフェイスのいずれかを選択できます。
  • Webインターフェースでダウンロードする場合:
    • Navigate to https://www.ebi.ac.uk/empiar using any one of the following browsers: Firefox, Chrome, Internet Explorer or Opera
    • ウェブインターフェースを利用するには、Aspera Connect とウェブブラウザプラグインのインストールが必要です。 まだインストールしていない場合は、Aspera Connect のインストールサイトへのリンクが表示されます。
    • Aspera Connectとブラウザプラグインをインストールした後、1列目に表示されているダウンロードアイコンをクリックすると、 表中にあるデータセットをダウンロードすることができます。
  • コマンドラインインターフェイスを使ったダウンロードの方法は、こちらを御覧ください。
  • Globus経由でのダウンロード方法はこちらをご覧ください。
  • ftp経由でのダウンロード方法はこちらをご覧ください。

Aspera Connectクライアントをインストールするにはどうすればよいですか?

  • 適切なオペレーティングシステム用の Aspera Connect をダウンロードします。
  • Linuxマシンでは、シェルスクリプトか.tar.gzファイルをダウンロードすることになります。 .shファイルをダウンロードした場合は、それをダウンロードして実行します。 .tar.gzファイルをダウンロードした場合は、パッケージを解凍し、インストール手順に従ってください。

コマンドラインを使用してデータをダウンロードするにはどうすればよいですか?

  • Asperaコピーコマンドは、Linuxマシンでは ~/.aspera/connect/bin ディレクトリに、Macでは ~/Applications/Aspera Connect.app/Contents/Resources ディレクトリにデフォルトでインストールされています。 ascpプログラムはこのディレクトリにあります。
  • インストールがまだの方は Download and install the Aspera Connect client を参考にしてください。
  • 例)EMPIAR-10009をダウンロードする場合:
  • $ ascp -T -k3 -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -P 33001 -d emp_ext3@fasp.ebi.ac.uk:/10009 ~/path_to/
    
    $ rsync -avP rsync://empiar.pdbj.org/empiar/archive/10009 ./
    
    $ ftp -p anonymous@empiar.pdbj.org 
    ftp> cd pub/empiar/archive/10009/data
    250 Directory successfully changed.
    ftp> mget *
    

ダウンロードのテスト用の小規模なデータはありますか?

  • 58MBのtestデータセットが利用できます。
  • $ ascp -T -k3 -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -P 33001 -d emp_ext3@fasp.ebi.ac.uk:/test ~/

EMPIARではORCIDはどのように使われているのですか?

ORCID iDは、預託の過程で提供されたすべての著者のエントリーページに表示されます。 これにより、Europe PMC検索や著者のORCIDプロファイルページから直接、著者の論文リストに素早く簡単にアクセスすることができます。

EMPIARはこの度、ORCIDを預託システムに統合しました。 ユーザーは、ORCIDアカウントを使用してシステムにサインインすることができます。 これにより、ORCID iD、姓名、電子メールなどのユーザープロファイルのフィールドが自動的に入力されます。

EMPIARのエントリーをORCiDのプロフィールに登録することは可能ですか?

はい。詳細はこちらでご確認ください。

EMPIARはどのようなフォーマットに対応していますか?

画像データは、アップロードされたフォーマットで提供します。 MRC、MRCS、TIFF、DM4、IMAGIC、SPIDER、MRC FEI、RAW FEI、BIG DATA VIEWER HDF5など、現場でよく使われているフォーマットの使用を推奨しています。

EMPIARのデータはどのようなライセンスで提供されていますか?

EMPIARのすべてのデータは、CC0ライセンスのもと、グローバルコミュニティで自由に公的に利用することができます。

どのようなクライオ電子顕微鏡データを預ければよいでしょうか?

EMPIARでは、クライオ電顕、クライオ電子線トモグラフィー、各種 Volume EM、X線顕微鏡、相関イメージング研究など、様々なイメージングモダリティのデータを受け付けています。 クライオ電顕・クライオ電子線トモグラフィーの場合、EMPIARへのデータの預け入れは「生」の状態で行うことを推奨します(例:単一粒子研究、アラインメントされていないマルチフレーム顕微鏡写真)。 これにより、例えば、検証、手法開発、教育、コミュニティの課題などのために、データの再利用や再処理が幅広く可能になります。 また、下流の中間ファイル(例:運動補正された顕微鏡写真、粒子座標、粒子スタック、オイラー角とアライメントを割り当てた粒子スターファイル)を提供することも、EMワークフローの特定のステップに関心を持つユーザーを支援するために推奨されます。

可能な限り多く提供することが理想的です。例えば:
  • オートピッキングアルゴリズムの開発には、motion-correct された顕微鏡写真が有効です。
  • 生動画は、将来的に解像度を向上させたり、データセットからより多くの情報を引き出す可能性があります。
  • 粒子スタックは最も再現性が高く、フレキシブルな解析に取り組む際に最も便利なフォーマットです。
  • 最終的なモデルに含まれる粒子だけでなく、すべての関連する粒子のSTARファイルも、柔軟性のある解析に役立ちます。
  • 各クラスの最終的なSTARファイルは、公開された構造を "ほぼ "再現することができ、さらに、悪い動画は最終粒子を与えないので、良い動画と悪い動画の情報を暗黙的に含んでいます。

メタデータに関しては、EMPIARの預託フォームには、すでに画像数、画像あたりのフレーム数、画像フォーマット、サイズ、ピクセル間隔、型に関する情報を収集します。 さらに、例えば、Cs、フレームあたりの電子線量、gain-reference orientation など、再処理に不可欠なパラメータに関する情報は、「詳細」フィールドで提供することが可能です。 さらに、Scipion のワークフロー(将来的には他のパッケージのワークフローも)を投稿の一部としてアップロードすることができます。

データおよびファイルの種類、フォーマット、拡張子を含む EMPIAR の要求事項の全リストは、オンラインで入手できます。 EMPIARのポリシーと処理手順については こちらを参照ください。 EMPIARのデポジションプロセスに関するガイダンスについては、デポジションマニュアルを参照してください。

注: Cryo以外のデータについては、別の要件と推奨事項があります。

EMPIARにデータを預託するにはどうすればよいですか?

オンライン預託システムを利用します。 まずはマニュアルを確認することから始めましょう。

提出したデータはどのように処理され、いつ公開されるのでしょうか?

Submit ボタンを押すと、EMPIAR アノテーションチームによるレビューのために預託が送信されます。 チームは問題点について預託者と連絡を取り、補足的な詳細やデータが必要な場合は、預託を解除することができます。 この作業が完了すると、預託者に EMPIAR アノテーションチームによるキュレーションの承認依頼が送信されます。 預託者の承認を受けると、預託者が提供した指示に従い、エントリーは公開フェーズに移行します。 公開までにかかる時間は、エントリーのサイズ、ファイル数、EMBL-EBI リソースの現在の負荷、アノテーションスタッフの稼働率に依存します。 エントリーが公開されると、預託者に電子メールで通知されます。

EMPIARのエントリーを引用するにはどうすればいいですか?

原著論文を引用し、EMPIARのエントリーを引用する際は、こちらのガイドラインをご利用ください。

EMPIARを引用するにはどうしたらいいですか?

ここに記載されているガイドラインに従うことをお勧めします。

エントリーのファイルやディレクトリを選択的にダウンロードすることはできますか?

はい。EMPIARのエントリーページでは、Aspera、http によるtarballのダウンロード、ftpによる個別ファイルのダウンロードの3つのオプションが用意されています。 EMPIAR のエントリーページのファイルブラウザでは、Aspera または http でダウンロードするファイルやサブディレクトリを選択することができます。 Aspera は推奨オプションで、あらゆるサイズのダウンロードに使用できます。 ダウンロードは、選択されたファイルとディレクトリのそのままの構造であり、アーカイブ(tar-ball)ではないことに注意してください! http ダウンロードオプションは、Aspera を作成します。http download オプションは、ダウンロード可能な tarball を作成します。 このオプションは、1.5GB 未満の tarball に対してのみ機能します。Ftp を使って個々のファイル(サブディレクトリは不可)をダウンロードすることもできます("Browse Ftp "を選択します)。

Globus経由でデータのアップロード/ダウンロードは可能ですか?

はい。データをダウンロードするには、エンドポイントを使用します。 EMBL-EBIのパブリックエンドポイントとディレクトリを共有します。/gridftp/empiar/world_availability/ Globusを使ったデータのアップロード方法については、預託マニュアルをご覧ください。

EMPIARデータモデルとは何ですか?

EMPIARスキーマについて説明はここを参照してください。 empiar.xsd の XMLスキーマファイルと empiar.sch の Schematron 形式の追加要求から構成されています。

データ転送でお困りですか?

ファイアウォールで転送がブロックされていないことを確認してください。
  • Globusの場合、hx-gridftp-*.ebi.ac.ukのアドレスがホワイトリストに登録されていることを確認する
  • Asperaの場合、以下のようにルールを修正する必要があるかもしれません。
    • permit TCP outbound to 193.62.197.71 on port 33001
    • permit UDP outbound to 193.62.197.71 on port 33001
    • permit UDP inbound from 193.62.197.71 on port 33001

私たちのウェブ転送インターフェースでは、目標レートを 200,000 Kbps に設定し、ポリシーを adaptive に設定しています。 上記コマンドラインも同様に表示されています。万が一、データ転送に問題がある場合は、ターゲットレートを下げるとよいかもしれません。

そのために、コマンドライン転送を利用し、'-l' パラメータの値を変更してください。
$ ascp -T -k3 -l 10M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -P 33001 -d emp_ext3@fasp.ebi.ac.uk:/test ~/
		

問題が解決しない場合は、ご連絡ください。 可能であれば、Aspera logs を提供してください。

EMPIARチームへの連絡方法を教えてください。

Send us a message!


Ito F, Alvarez-Cabrera AL, Liu S, Yang H, Shiriaeva A, Zhou ZH, Chen XS. (2023)
Rigden DJ, Fernández XM. (2023)
Iudin A, Korir PK, Somasundharam S, Weyand S, Cattavitello C, Fonseca N, Salih O, Kleywegt GJ, Patwardhan A. (2023)
Serra Lleti JM, Steyer AM, Schieber NL, Neumann B, Tischer C, Hilsenstein V, Holtstrom M, Unrau D, Kirmse R, Lucocq JM, Pepperkok R, Schwab Y. (2023)
Caldwell BJ, Norris AS, Karbowski CF, Wiegand AM, Wysocki VH, Bell CE. (2022)