crossref.cz
redakční systém Actavia

CrossRef

CrossRef je oficiální mezinárodní registrační agentura, která poskytuje organizační a technickou infrastrukturu pro registraci a využití DOI (Digital Object Identifier – digitální identifikátor objektu) v oblasti vědeckého výzkumu.

Společnost CrossRef vznikla na začátku roku 2000 jako nezisková síť založená na spolupráci vydavatelů. Jejím základním cílem je vytvořit spolehlivé a efektivní pozadí pro jednoznačnou identifikaci a propojení elektronických vědeckých dokumentů napříč vydavateli (články v časopisech, sborníky, knihy a další).

V kontextu CrossRef je nejběžnějším objektem, jemuž je DOI přiřazován, článek elektronicky publikovaného časopisu, ale DOI je možné přidělit také např. knihám, číslům nebo ročníkům časopisů či tabulce nebo obrázku v článku.

V systému CrossRef je ke každému DOI přiřazena sada základních metadat a URL odkaz na plný text. Tak je jednoznačně identifikován obsah položky a zajištěn trvalý hypertextový odkaz na jeho umístění na internetu (odolný vůči změnám umístění po přestavbách webů apod.). Vydavatel má zároveň pod kontrolou přístup k plnému textu (může jej zpřístupnit jen autorizovaným uživatelům, zpoplatnit atd.).

Dalším krokem je pak přidání odchozích odkazů (outbound links) ke každé referenci článku, která odkazuje na obsah (např. jiný odborný článek) registrovaný v systému CrossRef.

CrossRef není databází článků (neuchovává plné texty ani abstrakta) – DOI využívá ke spolehlivému prolinkování např. referencí u vědeckých článků na jejich plné digitální texty (nebo na jejich abstrakta), funguje tedy jako jakási digitální ústředna.

CrossRef nabízí členským institucím i další služby, jako např. Cited-by Linking (zobrazení informace o citovanosti u článků), CrossCheck nebo CrossMark.

V březnu roku 2014 bylo zapojeno do systému CrossRef více než 4800 spolupracujících institucí (velkých i malých, komerčních i neziskových vydavatelů, nakladatelů, odborných a vědeckých společností apod.), které registrovaly přes 89 miliónů DOI.

Počátky CrossRef

CrossRef vyvinuli vydavatelé odborné literatury. Původní služba byla založena na prototypu vyvinutém John Wiley & Sons a Academic Press, ve spolupráci s International DOI Foundation (IDF). Předlohou byl projekt uvedený IDF, Asociací amerických vydavatelů (Association of American Publisher, AAP) a Korporací pro národní výzkumné iniciativy (Corporation for National Research Initiatives, CNRI).

Vlastním počátkem je rok 2000, kdy přední světoví vydavatelé odborné literatury vytvořili neziskovou členskou organizaci Publishers International Linking Association, Inc. (PILA), která od té doby provozuje CrossRef.

Kdo se účastní na systému CrossRef

Členem agentury CrossRef se může stát jakýkoliv vydavatel, který publikuje primárně původní výzkumné materiály dostupné v elektronické formě online – nezávisle na velikosti, zda je komerční nebo neziskový či zda je nováčkem nebo tradičním vydavatelem.

CrossRef využívají a na jeho chodu se podílejí také další typy organizací:

  • Knihovny díky němu rozšiřují své online katalogy a databáze o odkazy na své fondy tam, kde je to vhodné.
  • Zprostředkující organizace mohou díky partnerství s CrossRef obohacovat svůj obsah o trvalé odkazy na plný obsah vydavatelů.
  • Technologické společnosti vytvářejí softwarové nástroje, které umožňují napojení na CrossRef.

Fungování systému a povinnosti vydavatelů

Přidělení DOI a uložení metadat

Pro každou obsahovou položku, kterou chce vydavatel registrovat v systému CrossRef (typicky článek), vytvoří jedinečné jméno DOI, které vloží do metadat článku a na URL článku (a případně také do tištěné verze článku).

Následně odešle vydavatel do databáze metadat CrossRef (MDDB) záznam ve formátu XML (podle určeného schématu, který spojí citační metadata s DOI. CrossRef pak registruje pro každý článek jeho DOI a URL u centrálního správce DOI.

Od této chvíle mohou všichni uživatelé získat DOI objektu ze systému CrossRef a vytvářet trvalé příchozí odkazy (inbound links) na vydavatelův obsah. Proto mají být DOI a metadata ukládány až po publikaci online – ale zároveň co nejdříve po publikování obsahu online (nejlépe do 24 hodin).

Metadata příslušející k DOI mohou obsahovat:

  • základní bibliografická data včetně všech autorů, ročníku, čísla, čísel stránek nebo čísla článku, název článku,
  • reference, které se v materiálu objevily,
  • seznam obrázků, tabulek nebo dalších částí materiálu, kterým může být užitečné přidělit DOI, aby na ně bylo možné odkazovat.

Ze zaslaných metadat článku určí CrossRef metadata časopisu, včetně názvů časopisu, zkratek názvu (tolik variant, kolik je možné), ISSN (online, tištěná verze atd.), data zveřejnění na webu (ročník, číslo, stránka, datum na obálce) a vydavatele.

Odchozí odkazy (outbound links) v referencích, vyhledání DOI

V jiném procesu vydavatel odesílá reference obsažené v každém uloženém článku do směrovače referencí (Reference Resolver). Tím vydavatel (a je to i jeho povinností vyplývající z členství v CrossRef) přidává odchozí odkazy (outbound links) ke každé referenci článku, která odkazuje na obsah registrovaný v systému CrossRef. Sankcí pro členy, kteří v úvodních 18 měsících svého členství nebudou mít v referencích svých článků odchozí odkazy (outbound links), může být pozastavení jejich účtu u CrossRef.

Vyhledávací rozhraní CrossRef umožňuje získat DOI a vytvořit trvalý odkaz na objekt všem uživatelům, kteří mají o položce nějakou informaci (např. jméno časopisu, autor, jméno článku).

DOI je možné vyhledat různými způsoby:

  • Dotaz s využitím XML (XML Queries) – soubory XML ve formátu vyžadovaném CrossRef lze do systému odeslat jako jednotlivý požadavek nebo jako dávku. Dotaz s využitím XML umožňuje kontrolu průběhu a výsledků a je vhodnou metodou pro většinu vydavatelů.

Další 2 způsoby slouží spíše menším vydavatelům, kteří mají omezené technické zdroje, nebo koncovým uživatelům, jako jsou autoři, badatelé nebo knihovníci:

  • Dotazovací formulář pro prostý text (Simple Text Query form) – vložení seznamu referencí do webového formuláře – rozhraní pro ruční zadání vhodné pro malé množství dotazů.
  • Dotaz přes upload prostého textu (Simple Text Query upload) – upload seznamu referencí v souboru TXT, výsledek je vrácen e-mailem – rozhraní pro ruční vložení vhodné pro malé množství dotazů.

Znalost DOI článku je jediným údajem, který je třeba pro jeho trvalou lokalizaci (pro vytvoření odkazu stačí před DOI pouze vložit řetězec http://dx.doi.org/). Pokud vydavatel změní umístění článku, musí zaktualizovat jeho URL na jediném místě – v databázi CrossRef (je to jedna z důležitých povinností vydavatele, která zajišťuje fungování systému).

Směrování DOI a cílová stránka (response page)

Pro směrování (resolution) DOI je používán systém Handle (Handle System), provozovaný CNRI v zastoupení IDF.

Pokud uživatel klikne na odkaz obsahující DOI, pošle jej systém pro směrování DOI na URL zadanou vydavatelem (response page), kde musí být uvedena plná bibliografická citace článku, DOI a informace o možnosti přístupu k plnému textu. Velmi doporučené je umístit sem také abstrakt.

Cílová stránka (response page) musí být aktivní ve chvíli uložení DOI a metadat do systému CrossRef.

Oprávnění uživatelé se dostanou k plnému textu (v některých případech je k dispozici všem), ostatní mají jiné možnosti pro přístup (jako předplatné, zakoupení článku nebo platba za zhlédnutí – pay-per-view). Přístupnost plného textu je zcela v pravomoci vydavatele. Čtenář článku tak může jednoduše přecházet z referencí jednoho článku na obsah článku odkazovaného bez ohledu na časopis nebo vydavatele.

K jednomu DOI může být v systému CrossRef přiřazeno i více URL – to umožňuje tzv. vícenásobné směrování (multiple resolution). Uživateli je nejdříve zobrazena mezistránka (interim page) s několika odkazy na cílový objekt (např. různé formáty).

Pro směrování DOI je v současnosti nejvíce využíván proxy server dx.doi.org – před vlastní DOI stačí do odchozího odkazu (outbound link) nebo do adresního řádku prohlížeče vložit řetězec http://dx.doi.org/.

Souhrn povinností vydavatelů

  • Přidělovat DOI a odesílat do systému CrossRef metadata ve formátu XML pro všechny články, jejichž plný text je dostupný online.
  • Přidávat odchozí odkazy DOI (outbound links) (pokud jsou dostupné) do seznamu referencí.
  • Všechny CrossRef DOI musí směřovat na platnou cílovou stránku (response page).
  • Pravidelně kontrolovat své transakce s CrossRef, sledovat upozornění a opravovat nalezené chyby.
  • Dbát na aktualizaci metadat svých DOI, především na URL zdroje.
  • Řešit případné duplicity přidělených DOI. (Systém CrossRef kontroluje, zda stejný DOI není přidělen vícekrát, a eventuálně upozorní na chybu.) Stejně tak je vydavatel zodpovědný za to, aby jednomu objektu nebyl přidělen více než jeden DOI.

Poplatky

Kvůli trvalému fungování systému a jeho nezávislosti na dotacích nebo práci neplacených nadšenců, je systém nastaven tak, aby své financování zabezpečil sám. Tím je zajištěno dlouhodobé organizační a technické zázemí i průběžný rozvoj.

Zúčastnění vydavatelé proto platí jednak roční poplatek, který je závislý na jejich vydavatelských tržbách, a dále také drobnou částku za každý přidělený DOI a jeho vložení do systému.

Poplatky za uložení jsou závislé na typu obsahu a datu zveřejnění – vložení starších materiálů je levnější. Rok publikace uvedený při uložení DOI a metadat do systému určuje, zda je DOI považováno za letošní (CY – Current Year) nebo starší (BY – Back Year). Označení "CY - current year" je zavádějící, vyšší sazbou se zpoplatňují tři roky. Schéma CrossRef umožňuje zadat datum publikace v tisku i na webu. Pokud jsou zadána obě data, poplatek se určuje podle data zveřejnění tištěné verze, jinak se bere v úvahu zveřejnění online. U časopisů je každý jednotlivý materiál posuzován zvlášť, bez ohledu na rok publikace uvedený u ročníku nebo čísla časopisu.

Podrobnosti: Publisher fees.

Další služby momentálně dostupné v systému CrossRef

Mezi další služby, které CrossRef nabízí členským institucím, patří:

  • Předávání parametrů – díky němu lze zaslat klíč nebo nějaký zakódovaný text (jako informace o zdroji příchozího odkazu) společně s DOI.
  • Cited-by Linking – zobrazení aktuální informace o citovanosti u článků, také umožňuje doplnit odkazy na materiály, ve kterých se tyto citace objevují.
  • CrossCheck – vyhledávání plagiátů v rámci systému CrossRef, služba je zpoplatněna.
  • CrossMark – umožňuje uživatelům rozpoznat, zda jde o aktuální verzi daného dokumentu („publisher-maintained copy“).

Cited-by Linking

Vydavateli hojně využívanou službou je Cited-by Linking. Dodává informace, nakolik byl článek citován jinými publikacemi, a umožňuje vydavatelům doplnit ke svým článkům odkazy na materiály, ve kterých se tyto citace objevují.

Účast na této službě je dobrovolná a bezplatná, přihlásit se mohou jen aktivní členové CrossRef. Pokud se ale vydavatel pro účast rozhodne, musí do metadat doplnit seznam prací, které jsou v článku citovány.

Stejně jako u všech iniciativ CrossRef je užitečnost služby Cited-by Linking přímo úměrná jejímu přijetí členy. A přestože CrossRef tuto službu aktivně propaguje, účast je prozatím omezená. To znamená, že užitečnost informací o citovanosti se velmi liší v závislosti na oboru a vydavateli.

I když existují další služby, které nabízejí tuto funkci (např. Google Scholar, Scopus nebo ISI), CrossRef Cited-by Linking je z nich nejkomplexnější.

Důvody:

  • Služba je kontrolována a řízena členstvím v CrossRef a proto umožňuje přímé odkazy od vydavatele na jiného vydavatele bez nutnosti dalšího zprostředkování.
  • Není svázána s nějakou dílčí „metrikou“ – i když metadata dodávaná službou mohou být využita k ověření existující metriky nebo jako základ pro vytvoření metriky nové.
  • Není omezena disciplínou, a proto je užitečná pro zjištění jinak těžko dohledatelných mezioborových citací a pro použití vydavateli v oblastech, které se potýkají s nedostatkem jiných obdobných služeb.
  • Není omezena typem obsahu – CrossRef přijímá data o referencích článků, monografiích, referenčních pracích atd.
  • Je vystavěna na vrcholu infrastruktury DOI a jako taková je velmi přesná.
  • CrossRef je stále více považován za zdroj souhrnných směrodatných vydavatelských metadat. A u uživatelů služeb CrossRef je patrná zvyšující se tendence shromažďovat data o referencích. Proto panuje obava, že pokud uživatelé nebudou moci tato metadata získat od CrossRef, uchýlí se k užívání mnohem méně přesných informací, která mohou získat prostřednictvím tzv. screen scraping (automatická analýza webových stránek) a služeb jako Google Scholar.

Poznámka: protože službu používá jen část členů CrossRef, je možné získat jen neúplný seznam DOI, která citují daný obsah. CrossRef Cited-by Linking tak nemůže sloužit jako citační metrika.

V březnu 2014 kontrolovali vydavatelé účastnící se na službě Cited-by Linking přibližně 40 % DOI uložených v systému CrossRef.

Pro využívání této služby musí vydavatelé provést 2 akce:

  • Dodat na CrossRef seznam referencí pro všechny články uložené v systému CrossRef.
  • Pro každý článek, u kterého mají být zobrazovány odkazy na práce, které jej citovaly, je nutné poslat dotaz na CrossRef (s použitím DOI) – jako odpověď je vrácen seznam citujících článků identifikovaných svým DOI.