Specifikace XML souboru
- Význam jednotlivých elementů
- Požadavky na kvalitní XML soubor
- Ukázka základní podoby XML souboru
- Zpracování XML souboru
- Nejčastější chyby
Ukázka základní podoby XML souboru:
Aby mohlo dojít k importu produktů do našich vyhledávačů, je zapotřebí mít vytvořený tzv. XML soubor (neboli XML FEED), což je jednoduchý datový formát, pomocí kterého nám předáte informace o vašem zboží a jeho cenách. XML soubor je automaticky generován z vašich stránek, a proto jeho vytvoření či úpravy konzultujte se svým webmasterem.
Heureka XML feedy nevytváří ani neupravuje. Proto je třeba se ohledně případných chyb obrátit přímo na svého programátora, nebo hostingovou agenturu. Za vytvoření a následnou úpravu XML souboru odpovídá právě obchod.
Export dat je základ úspěšnosti vašeho zobrazování na Heurece a proto jej doporučujeme připravit dle níže uvedených specifikací k jednotlivým položkám. Maximální počet prodejných položek v XML souboru je 500 000 a lze k nám předat pouze jednu URL základního XML souboru. Nelze rozdělit feed na dva feedy a navýšit tím tak počet položek.
Význam jednotlivých značek
SHOP | SHOPITEM | ITEM_ID | PRODUCTNAME | PRODUCT | DESCRIPTION | URL | IMGURL | IMGURL_ALTERNATIVE | PRICE_VAT | VAT | ITEM_TYPE | PARAM | MANUFACTURER | MANUFACTURER_POSTAL_ADDRESS | MANUFACTURER_ELECTRONIC_ADDRESS | CATEGORYTEXT | EAN | ISBN | HEUREKA_CPC | DELIVERY_DATE | DELIVERY | ITEMGROUP_ID | ACCESSORY | GIFT | EXTENDED_WARRANTY | SPECIAL_SERVICE | SALES_VOUCHER
Kvalitní XML soubor obsahuje tyto tagy:
XML soubor obsahuje důležité tagy:
- PRODUCTNAME – přesný název produktu – povinné
- ITEM_ID – jednoznačná a trvalá identifikace produktu – povinné
- PRICE_VAT – cena produktu – povinné
- URL – unikátní adresa, která odkazuje na daný produkt – povinné
- CATEGORYTEXT – celá kategorizační cesta k produktu
- DELIVERY – nabízená doprava k jednotlivým produktům
- DELIVERY_DATE – správné uvádění dostupnosti produktů
- IMGURL – obrázek produktu
- ITEMGROUP_ID – varianty velikostí, barev, vzorů atd. jsou jednotlivé produkty, které je možné sdružovat
<?xml version="1.0" encoding="utf-8"?> <SHOP> <SHOPITEM> <ITEM_ID>AB123</ITEM_ID> <PRODUCTNAME>Nokia 5800 XpressMusic</PRODUCTNAME> <PRODUCT>Nokia 5800 XpressMusic</PRODUCT> <DESCRIPTION>Klasický s plným dotykovým uživatelským rozhraním</DESCRIPTION> <URL>http://obchod.cz/mobily/nokia-5800-xpressmusic</URL> <IMGURL>http://obchod.cz/mobily/nokia-5800-xpressmusic/obrazek.jpg</IMGURL> <IMGURL_ALTERNATIVE>http://obchod.cz/mobily/nokia-5800-xpressmusic/obrazek2.jpg</IMGURL_ALTERNATIVE> <PRICE_VAT>6000</PRICE_VAT> <HEUREKA_CPC>5,8</HEUREKA_CPC> <MANUFACTURER>NOKIA</MANUFACTURER> <MANUFACTURER_POSTAL_ADDRESS>Pučálkovic 234, 23451 Zlobice</MANUFACTURER_POSTAL_ADDRESS> <MANUFACTURER_ELECTRONIC_ADDRESS>hogofogo@homolka.cz</MANUFACTURER_ELECTRONIC_ADDRESS> <CATEGORYTEXT>Elektronika | Mobilní telefony</CATEGORYTEXT> <EAN>6417182041488</EAN> <PARAM> <PARAM_NAME>Barva</PARAM_NAME> <VAL>černá</VAL> </PARAM> <DELIVERY_DATE>2</DELIVERY_DATE> <DELIVERY> <DELIVERY_ID>CESKA_POSTA</DELIVERY_ID> <DELIVERY_PRICE>120</DELIVERY_PRICE> <DELIVERY_PRICE_COD>120</DELIVERY_PRICE_COD> </DELIVERY> <DELIVERY> <DELIVERY_ID>PPL</DELIVERY_ID> <DELIVERY_PRICE>90</DELIVERY_PRICE> <DELIVERY_PRICE_COD>120</DELIVERY_PRICE_COD> </DELIVERY> <ITEMGROUP_ID>EF789</ITEMGROUP_ID> <ACCESSORY>CD456</ACCESSORY> <GIFT>Pouzdro zdarma</GIFT> <EXTENDED_WARRANTY> <VAL>36</VAL> <DESC>Záruka na 36 měsíců</DESC> </EXTENDED_WARRANTY> <SPECIAL_SERVICE>Aplikace ochranné fólie</SPECIAL_SERVICE> <SALES_VOUCHER> <CODE>SLEVA20</CODE> <DESC>Sleva 20% po zadání kódu do 31.12.2021!</DESC> </SALES_VOUCHER> </SHOPITEM> <SHOPITEM> ... </SHOPITEM> </SHOP>
Upozornění:
Kódování znaků UTF-8
Pracujeme s kódováním znaků UTF-8. Při použití jiného druhu kódování může být problém se správným zobrazením dat.
Export neobsahuje položky, které jsou neprodejné, nedostupné a vyprodané. Při změně URL adres vašich produktů, názvů produktů či kategorií v XML se na Heurece odpárují všechny produkty a poté se znovu čeká na jejich spárování, které může trvat cca 4 pracovní dny. Je proto nutné v XML souboru zachovávat stejné URL adresy.
Varianty produktů
Pokud prodáváte produkty např. oblečení, matrace, jízdní kola, kolečkové brusle, kočárky, satelitní komplety atd., kde produkty mají pod unikátním EAN variantu lišící se barvou, vzorem, materiálem, rozměry, komponenty, velikostí atd., věnujte velkou pozornost oddílu Varianty, tag ITEMGROUP_ID.
Dostupnostní XML
Detailní a aktuální informace o dostupnosti zboží lze poskytovat také prostřednictvím samostatného XML feedu (více o dostupnostním XML)
Zpracování XML souboru
Váš XML soubor stahujeme každé dvě hodiny v případě PPC režimu, abychom vždy zajistili aktuální ceny. V případě FREE režimu je XML soubor stahován každé čtyři hodiny. Z vaší strany je třeba vždy zajistit aktuálnost souboru, aby data byla co nejrelevantnější.
Komprimace XML Souboru
Základní XML soubor přijímáme také ve formátu GZip. Lze tedy použít GZip kompresi HTTP přenosu tohoto souboru. Stačí mít váš HTTP server nakonfigurovaný tak, aby tuto kompresi podporoval, což je většinou standardní chování. Ke komprimaci pak dojde transparentně na straně HTTP serveru a k dekomprimaci pak opět transparentně na straně našeho HTTP serveru. Dojde tak k úspoře objemu přenesených dat, avšak i tak přijímáme XML soubor s maximálně 500 000 položkami k prodeji v režimu PPC i režimu FREE.
Aktualizace XML hlavičky
Před samotným stažením XML souboru kontrolujeme datum jeho poslední modifikace prostřednictvím HTTP hlavičky „Last-Modified“. Doporučujeme tedy nakonfigurovat HTTP server tak, aby tuto informaci v hlavičce odpovědi odesílal. Předejde se tak zbytečné zátěži serverů na obou stranách, způsobené stahováním nezměněných XML souborů.
Popis jednotlivých elementů:
MANUFACTURER_ELECTRONIC_ADDRESS
Vytvoření XML souboru pomocí CDATA
Tohoto zápisu využijete v případě textů, kde se vyskytuje příliš mnoho nepovolených znaků znaků (např. &, <, >)
<MANUFACTURER><![CDATA[Black & Decker]]></MANUFACTURER>
Nejčastější chyby
1) Nenahrazení některých znaků (např. „&“, „<„, „>“) entitami
<MANUFACTURER>Black & Decker</MANUFACTURER>
Možné řešení:
<MANUFACTURER>Black & Decker</MANUFACTURER>
<MANUFACTURER><![CDATA[Black & Decker]]></MANUFACTURER>
Více o entitách v článku na serveru Interval.cz DTD: entity a notace.
2) Neuzavřený element
<PRODUCT>Clinique Happy EdP 30ml <DESCRIPTION>Tenoučký slide-up s bohatou multimediální výbavou</DESCRIPTION> <URL>http://obchod.cz/parfemy/clinique-happy-edp</URL>
3) Chybný formát url
<IMGURL>/parfemy/clinique-happy-edp/obrazek.jpg</IMGURL>
<IMGURL>není</IMGURL>
<URL>http://obchod.cz/noční krém</URL>
4) Tagy malými písmeny
Máte v XML souboru vyplněny například parametry produktu, či dopravu, ale nezobrazují se vám na Heurece? Zkontrolujte, zda neuvádíte tagy malými písmeny. Takové tagy Heureka nezpracuje. Tagy je vždy potřeba uvádět velkými písmeny.
<param> <param_name>barva</param_name> <val>červená</val> </param>
<delivery> <delivery_id>CESKA_POSTA</delivery_id> <delivery_price>45</delivery_price> <delivery_price_cod>58</delivery_price_cod> </delivery>