Elintarvikkeiden koostumustietopankit kansainvälisessä vertailussa – yhtäläisyydet, erot ja tutkimukselliset vaikutukset
Elintarvikkeiden koostumustietopankit (Food Composition Databases, FCDB) muodostavat perustan ravitsemustieteelle, kansanterveydelle ja elintarvikepolitiikalle. Niiden avulla kuvataan ruoka-aineiden ja elintarvikkeiden ravintoainesisältöä, arvioidaan väestön ravitsemustilaa ja suunnitellaan ravitsemusohjelmia. Viimeaikaiset tutkimukset (Gora ym., 2021; Williams ym., 2024; Brinkley ym., 2025) osoittavat kuitenkin, että tietopankkien laatu, kattavuus ja tekninen toteutus vaihtelevat huomattavasti eri maiden ja käyttötarkoitusten välillä.
Tietopankkien rakenteelliset ja sisällölliset erot
Euroopan Food Information Resource (EuroFIR) -verkosto on ollut keskeinen toimija tietopankkien harmonisoinnissa. Gora ym. (2021) kuvaavat, että EuroFIR kokoaa yhteen 33 maan tietokannat ja pyrkii yhtenäistämään niiden tietorakenteet ja laadunvarmistuksen. Tietopankit eroavat kuitenkin sisällöltään: esimerkiksi Tanskan Frida-tietokanta sisältää yli 100 ravintotekijää ja yli tuhat elintarviketta, kun taas Espanjan BEDCA on suppeampi. Britannian CoFID-taulukko on poikkeuksellisen kattava, mutta tutkijat korostavat, että eri maiden tietopankkien sisältö, analyysimenetelmät ja ravintoaineiden luokittelut vaihtelevat, mikä voi vaikeuttaa kansainvälistä vertailua.
Brinkley ym. (2025) analysoivat 101 tietopankkia 110 maasta ja havaitsivat valtavaa vaihtelua elintarvikkeiden ja ravintotekijöiden määrässä. Vain kolmannes tietokannoista sisälsi yli 100 ravintotekijää, ja moni tietokanta perustui muiden lähteiden tietoihin ilman omaa laboratorioanalytiikkaa. Lisäksi lähes 40 prosenttia tietopankeista ei ole koskaan päivitetty, mikä heikentää niiden soveltuvuutta tieteelliseen tutkimukseen. Korkean tulotason maissa tietokannat ovat yleensä avoimempia ja päivittyvät useammin, kun taas matalan tulotason maissa ne ovat usein staattisia ja rajallisia.
Williams ym. (2024) keskittyivät erityisesti verkkopohjaisiin ravitsemustietokantoihin ja ruokapäiväkirjasovelluksiin, kuten MyFitnessPal- ja Nutracheck-sovelluksien taustalla toimiviin tietokantoihin. Joukkoistetulle (crowdsourced) datalle perustuvat alustat voivat sisältää miljoonia tuotteita, mutta niiden tarkkuus vaihtelee huomattavasti, ja tietojen alkuperä sekä validointikäytännöt jäävät usein epäselviksi. Tutkijat huomauttavat, että tällaisia tietoja hyödyntävien tutkimusten tulokset voivat olla epäluotettavia, ellei tietopankkien laatua arvioida kriittisesti.
Tulevaisuuden kehityssuunnissa korostuu avoimuus ja standardointi: datan lähteiden, analyysimenetelmien ja käyttöoikeuksien on oltava läpinäkyviä, ja yhteisiä sanastoja, kuten LanguaL-järjestelmää, tulisi hyödyntää laajemmin. Lisäksi FAIR-periaatteiden (Findable, Accessible, Interoperable, Reusable) mukainen datanhallinta on keskeinen edellytys kansainväliselle vertailtavuudelle. Samalla tietopankkeihin tulisi sisällyttää nykyistä enemmän paikallisia ja kulttuurisesti merkittäviä elintarvikkeita, jotta ne kuvaisivat todellista ruokavaliota eivätkä vain länsimaista ruokavaliomallia.
Vaikutukset ravitsemustutkimukseen
Tietopankkien väliset erot vaikuttavat suoraan ravitsemustutkimusten tuloksiin ja johtopäätöksiin. Jos eri maiden tutkijat käyttävät eri lähteitä, ravintoaineiden saantia ja ruokavalion laatua koskevat tulokset voivat poiketa huomattavasti toisistaan, vaikka tutkimuskysymykset olisivat samat. Tämä vaikeuttaa kansainvälisiä vertailuja ja meta-analyysejä, ja voi johtaa harhaan myös ravitsemussuositusten laadinnassa. Lisäksi puutteellinen tieto paikallisista ruoista vääristää kokonaiskuvaa väestön ravitsemustilanteesta.
Yhteenvetona voidaan todeta, että ravitsemustietopankit ovat välttämättömiä, mutta niiden laatu ja vertailtavuus vaativat merkittävää kehittämistä. Avoimuus, laadunvarmistuksen ja analyysimenetelmien standardointi sekä monimuotoisuuden huomioiminen ovat keskeisiä edellytyksiä, jotta tutkimustulokset olisivat luotettavia ja yhteismitallisia. Tietopankkien tulisi olla teknisesti yhteentoimivia ja ajantasaisia, tieteellisesti tarkkoja sekä kulttuurisesti kattavia, jotta ne voivat palvella ravitsemustutkimusta ja -politiikkaa globaalilla tasolla.
Artikkeli on kirjoitettu osana Töysän Säästöpankkisäätiön rahoittamaa ” Ruokavalioiden ympäristövaikutukset ja laskentadatan luotettavuus suomalaisessa kontekstissa” -hanketta.
Terhi Junkkari
ETT, tutkijayliopettaja
ORCID 0000-0001-8816-7312
SEAMK
Mira Björkbacka
Insinööri (AMK), Bio- ja elintarviketekniikka, Restonomi (AMK), projektipäällikkö
SEAMK
Lähteet
Brinkley, S., Gallo-Franco, J. J., Vázquez-Manjarrez, N., Chaura, J., Quartey, N. K. A., Toulabi, S. B., Odenkirk, M. T., Jermendi, E., Laporte, M.-A., Lutterodt, H. E., Annan, R. A., Barboza, M., Amare, E., Srichamnong, W., Jaramillo-Botero, A., Kennedy, G., Bertoldo, J., Prenni, J. E., Rajasekharan, M., de la Parra, J., & Ahmed, S. (2025). The state of food composition databases: Data attributes and FAIR data harmonization in the era of digital innovation. Frontiers in Nutrition, 12, 1552367. https://doi.org/10.3389/fnut.2025.1552367
Gora, M. C., Cámara Hurtado, M., & Calderón Pascual, V. (2021). Comparative analysis of food composition tables and databases included in the EuroFIR network. Revista del Comité Científico de la AESAN, 34, 103–127. https://www.aesan.gob.es/AECOSAN/docs/documentos/seguridad_alimentaria/evaluacion_riesgos/informes_cc_ingles/COLLABORATION_COMPOSITION_TABLES.PDF
Williams, G., Hamilton, A., & Cade, J. E. (2024). Comparison of online food composition databases including those in nutritional assessment tools. Proceedings of the Nutrition Society, 83(OCE4), E339. https://doi.org/10.1017/S0029665124005779