Lisensya ng Mataas na kalidad na Data ng Pangangalagang Pangkalusugan/Medikal para sa Mga Modelong AI at ML

Mga Off-the-shelf na Healthcare/Medical Dataset para simulan ang iyong proyekto sa Healthcare AI

Catalog ng medikal na data

Isaksak ang data source na nawawala sa iyo ngayon

Mga dataset ng Medikal at Pangangalagang Pangkalusugan para sa Machine Learning

Data ng Audio sa Pagdidikta ng Doktor

Kasama sa aming na-de-identify na dataset para sa pangangalagang pangkalusugan ang 31 iba't ibang specialty na mga audio file na idinidikta ng mga doktor na naglalarawan sa klinikal na kondisyon at plano ng pangangalaga ng mga pasyente batay sa mga nakatagpo ng doktor-pasyente sa klinikal na setting.

Off-the-Shelf Physician Dictation Audio Files:

  • 257,977 oras ng Real-world Physician Dictation Speech Dataset mula sa 31 specialty para sanayin ang mga modelo ng Healthcare Speech
  • Dictation audio na nakunan mula sa iba't ibang device tulad ng Telephone Dictation (54.3%), Digital Recorder (24.9%), Speech Mic (5.4%), Smart Phone (2.7%) at Unknown (12.7%)
  • PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Data ng audio ng pagdidikta ng doktor

Na-transcribe na Mga Rekord na Medikal

Ang mga na-transcribe na medikal na rekord ay tumutukoy sa transkripsyon ng pag-uusap ng doktor at pasyente, transkripsyon ng mga medikal na ulat at medikal na pagtatasa. Nakakatulong ito sa pagmamapa ng medikal na kasaysayan ng pasyente para sa mga pagbisita sa hinaharap at nagsisilbi ring reference point para sa mga doktor. Nakakatulong ito na suriin ang kasalukuyang kalagayan ng pasyente at magmungkahi ng angkop na paggamot.

Off-the-Shelf na Transcribe na Mga Rekord na Medikal:

  • Transkripsyon ng 257,977 oras ng Real-world Physician Dictation mula sa 31 specialty para sanayin ang mga modelo ng Healthcare Speech
  • Na-transcribe na Mga Rekord na Medikal mula sa iba't ibang uri ng trabaho tulad ng Operative Report, Discharge Summary, Consultation Note, Admit Note, ED Note, Clinic Note, Radiology Report, atbp.
  • PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Mga electronic na rekord ng kalusugan (ehr)

Electronic Health Records (EHR)

Ang Electronic Health Records o EHR ay mga medikal na rekord na naglalaman ng kasaysayan ng medikal ng pasyente, mga diagnosis, reseta, mga plano sa paggamot, mga petsa ng pagbabakuna o pagbabakuna, mga allergy, mga larawan sa radiology (CT Scan, MRI, X-Ray), at mga pagsusuri sa laboratoryo at higit pa.

Off-the-Shelf Electronic Health Records (EHR):

  • 5.1M+ Records at mga audio file ng doktor sa 31 specialty
  • Real-world gold-standard na mga medikal na rekord upang sanayin ang Clinical NLP at iba pang mga modelo ng Document AI
  • Ang impormasyon ng metadata tulad ng MRN (Anonymized), Petsa ng Pagpasok, Petsa ng Paglabas, Mga araw ng Haba ng Pananatili, Kasarian, Klase ng Pasyente, Nagbabayad, Klase sa Pananalapi, Estado, Discharge Disposition, Edad, DRG, Paglalarawan ng DRG, $ Reimbursement, AMLOS, GMLOS, Panganib ng mortalidad, Kalubhaan ng sakit, Grouper, Hospital Zip Code, atbp.
  • Mga Rekord na Medikal mula sa iba't ibang estado at rehiyon ng US- North East (46%), South (9%), Midwest (3%), West (28%), Iba pa (14%)
  • Mga Rekord na Medikal na kabilang sa lahat ng Klase ng Pasyente na sakop- Inpatient, Outpatient (Clinical, Rehab, Recurring, Surgical Day Care), Emergency.
Mga electronic na rekord ng kalusugan (ehr)
  • Mga Rekord na Medikal na kabilang sa lahat ng Pangkat ng Edad ng Pasyente <10 yrs (7.9%), 11-20 yrs (5.7%), 21-30 yrs (10.9%), 31-40 yrs (11.7%), 41-50 yrs (10.4% ), 51-60 yrs (13.8%), 61-70 yrs (16.1%), 71-80 yrs (13.3%), 81-90 yrs (7.8%), 90+ yrs (2.4%)
  • Patient Gender ratio na 46% (Lalaki) at 54% (Babae)
  • PII Redacted Documents na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA

Dataset ng Larawan ng CT Scan

Gumagamit ang mga doktor ng CT scan na imahe upang masuri at tuklasin ang mga abnormal o normal na kondisyon sa katawan ng isang pasyente. Sa computerized image processing diagnosis, ang isang CT-scan na imahe ay dumaan sa mga sopistikadong yugto, viz., acquisition, image enhancement, extraction ng mahahalagang feature, Region of Interest (ROI) identification, result interpretation, atbp.

Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng imahe ng CT scan na mahalaga para sa pananaliksik at medikal na diagnosis. Kasama sa aming mga dataset ang libu-libong larawang may mataas na resolution na nakolekta mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong diskarte. Idinisenyo ang mga dataset na ito upang tulungan ang mga medikal na propesyonal at mananaliksik na mapabuti ang kanilang kaalaman at pag-unawa sa iba't ibang kondisyong medikal, kabilang ang cancer, neurological disorder, at cardiovascular disease. 

Ct scan na dataset ng larawan

Dataset ng Larawan ng MRI

Ang mga modelo ng computer vision ay idinisenyo upang makakuha ng makabuluhang impormasyon mula sa mga digital na larawan at video. Nagbibigay-daan ito sa malawakang paggamit ng data ng imahe ng pangangalagang pangkalusugan upang magbigay ng mas mahusay na diagnosis, paggamot, at paghula ng mga sakit. Maaari itong gumamit ng konteksto mula sa pagkakasunud-sunod ng larawan, texture, hugis, at contour na impormasyon, pati na rin ang nakaraang kaalaman, upang makagawa ng 3D at 4D na impormasyon na nakakatulong sa pinahusay na pag-unawa ng tao. Tulad ng mga CT scan, ginagamit din ang mga MRI upang masuri at makita ang mga abnormal o normal na kondisyon sa katawan ng isang pasyente (ibig sabihin, upang matukoy ang sakit o pinsala sa loob ng iba't ibang bahagi ng katawan).

Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng imahe ng MRI mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong pamamaraan.

dataset ng larawan ng Mri

X-Ray Image Dataset

Ang pagsusuri sa X-ray ay ginagamit upang i-verify ang panloob na istraktura at integridad ng bagay. Ang mga larawan ng X-ray ng isang bagay na pansubok ay maaaring mabuo sa iba't ibang posisyon at iba't ibang antas ng enerhiya upang masuri at matukoy ang mga abnormal na kondisyon sa katawan ng isang pasyente.

Nagbibigay ang Shaip ng mataas na kalidad na mga dataset ng larawan ng X-Ray na mahalaga para sa pananaliksik at medikal na diagnosis. Kasama sa aming mga dataset ang libu-libong larawang may mataas na resolution na nakolekta mula sa mga totoong pasyente at pinoproseso gamit ang mga makabagong diskarte. Sa Shaip, maaari mong ma-access ang maaasahan at tumpak na medikal na data upang mapahusay ang iyong pananaliksik at mapabuti ang mga resulta ng pasyente.

Dataset ng larawan ng X-ray
Shaip makipag-ugnayan sa amin

Hindi mahanap ang iyong hinahanap?

Ang mga bagong off-the-shelf na medikal na dataset ay kinokolekta sa lahat ng uri ng data 

Makipag-ugnayan sa amin ngayon para mawala ang iyong mga alalahanin sa pangongolekta ng data sa pagsasanay sa pangangalagang pangkalusugan

  • Sa pagrerehistro, sumasang-ayon ako kay Shaip Pribadong Patakaran at Mga palatuntunan at ibigay ang aking pahintulot na makatanggap ng komunikasyon sa marketing ng B2B mula sa Shaip.

Kasama sa mga medikal na dataset ang data ng pangangalagang pangkalusugan gaya ng pagdidikta ng doktor, mga na-transcribe na tala, EHR, at mga medikal na larawan (CT, MRI, X-ray) na ginagamit upang sanayin ang mga modelo ng AI.

Oo, ang mga dataset ay sumusunod sa mga regulasyon sa pangangalagang pangkalusugan gaya ng HIPAA at GDPR para matiyak ang secure at etikal na paggamit ng data.

Oo, maaaring iayon ang mga dataset batay sa mga partikular na specialty, demograpiko, format ng data, at mga kinakailangan sa proyekto.

Ang data ay sumasailalim sa mahigpit na pagsusuri sa kalidad, kabilang ang mga anotasyon ng mga eksperto sa domain, upang matiyak ang katumpakan at pagiging maaasahan. Ang bawat dataset ay idinisenyo upang matugunan ang mga kinakailangan sa pamantayang ginto.

Oo, ang mga dataset ay nasusukat upang matugunan ang maliit at malalaking kinakailangan ng proyekto, kabilang ang milyun-milyong record o oras ng audio.

Oo, ibinibigay ang mga dataset sa mga format na handa nang gamitin (hal., JSON, CSV) para sa tuluy-tuloy na pagsasama sa mga umiiral nang AI at ML workflow.

Nakadepende ang gastos sa mga salik tulad ng uri ng dataset, dami, pag-customize, at mga timeline ng paghahatid. Mangyaring punan ang form na "Makipag-ugnayan sa Amin" kasama ang iyong mga kinakailangan para sa isang quote.

Nag-iiba-iba ang mga timeline ng paghahatid batay sa pagiging kumplikado ng proyekto at laki ng dataset, ngunit nakabalangkas upang matugunan ang mga deadline ng iyong proyekto.

Ang mga de-kalidad na medikal na dataset ay mahalaga para sa pagsasanay ng mga modelo ng AI upang mapabuti ang katumpakan, i-automate ang mga gawain, at mapahusay ang paggawa ng desisyon sa pangangalagang pangkalusugan.