Mga Dataset ng Audio ng Pagdidikta ng Doktor para sa Healthcare AI

I-access ang 257,977 Oras ng Medikal na Audio Data sa 31 Specialty

Mga dataset ng data ng audio ng pagdidikta ng doktor

Isaksak ang data source na nawawala sa iyo ngayon

Mga Dataset ng Audio Dictation ng Doktor para sa Machine Learning

Kasama sa aming na-de-identify na dataset para sa pangangalagang pangkalusugan ang 31 iba't ibang specialty na audio file na idinidikta ng mga doktor na naglalarawan sa klinikal na kondisyon ng mga pasyente at plano ng pangangalaga batay sa mga nakatagpo ng doktor-pasyente sa setting ng ospital/klinikal.

Off-the-Shelf Physician Dictation Audio Files:

  • 257,977 oras ng Real-world Medical Audio Dataset mula sa 31 specialty para sanayin ang mga modelo ng Healthcare ASR
  • Dictation audio na nakunan mula sa iba't ibang device tulad ng Telephone Dictation (54.3%), Digital Recorder (24.9%), Speech Mic (5.4%), Smart Phone (2.7%) at Unknown (12.7%)
  • PII Redacted Audio at Transcripts na sumusunod sa Safe Harbor Guidelines alinsunod sa HIPAA
Data ng Medikal na Audio ayon sa Kasarian
SpecialityMga Audio File ng Pasyente (Playtime sa Oras)Kabuuang Bilang ng Mga Audio File

total

257,9775,172,766
Lalaki58,8502,444,910
Babae113,4061,290,900
Hindi kilala85,7211,436,956
Data ng Medikal na Audio ayon sa Espesyalidad
SpecialityMga Audio File ng Pasyente (Playtime sa Oras)Kabuuang Bilang ng Mga Audio File
Pain Medicine111
Podiatric Surgery424
Plastic surgery - espesyalidad13183
Sinabi ni Physician Asst.638
Physical Therapist1141713
Physical Medicine & Rehabilitation134723523
Pedyatrya8779271
Pediatric surgery223
Espesyalidad ng pediatric35682
Pediatric pulmonology440
Pediatric Dentistry15420
Patolohiya114343462
PANP10760145960
Podiatry89212056
Sakit Pamamahala230
Otolaryngology99519548
Osteopathic3105566
Orthopedic4849145053
Orthopedics at Sports Medicine1493165
Operasyon sa bibig113
Oral at Maxillofacial Surgeon18
Optalmolohista60919299
OPERATIVE CARE05
Oncology681682300
Occupational Therapist868
pagtitistis14431236788
Sugat Care15211
Vascular/General9268
PAG-OOPERA SA UGAT19156
Urolohiya317096934
Pagtitistis sa itaas na gastrointestinal458
Hindi kilala42269748054
Trauma at orthopedics1401308
Transplant332
Operasyong Thoracic437
Gamot sa thoracic527
Espesyalidad sa kirurhiko22290
Katulong ng Doktor sa Surgery03
Occupational medicine79763
sports Medicine349
Pagsasalita ng Therapy29327
Rheumatology13124
naninirahan46641
Rehabilitasyon251530078
Radiology10962630983
Pulmonary380964368
Psychotherapy (espesyalidad)50229
Saykayatrya887170269
PANGUNAHING PAG-AALAGA17
preventive Medicine21191
ng ngipin551233
Pangkalahatan26313
Gastroenterology312762158
Family Practice2622498
Family Nurse Practitioner4249018
Family Medicine13639263480
endokrinolohiya2193212
Espesyalista sa Emergency Room30378
Kagipitan367562256
Katulong ng Doktor sa ED070
Tenga, Ilong At Lalamunan51658
Diagnostic Radiology2557591
Dermatolohiya1483474
Pangkalahatang pagsasanay sa ngipin225
Kritikal Care7079645
Klinikal na pisyolohiya50160
Klinikal na hematology02
Cardiothoracic surgery110
Cardiothoracic17122
Kardyolohiya675041566721
APRN1631693
Anesthetics19
Anesthesiology67722280
Allergy at Immunology115222202
Aksidente at emergency9359
IH-Industrial Health73945
OB / GYN242442739
Nurse Practitioner – Pamilya9113
Nurse Practitioner81432
Neurosurgery86755
Neurolohiya147617786
Neuro/TBI1731157
Nephrology243139821
Gamot5122
Medikal na oncology1667
Internal Medicine, Pulmonary Medicine, Critical Care Medicine at Sleep Medicine5102
Internal Medicine At Nephrology15111
Internal Medicine42604623072

total

257,9775,172,766
Hospitalist991493
Hospice & Palliative Medicine441
SIYA019
Hematology - Oncology22394
Ginekolohiya425
GI55550
Geriatric Medicine4615323
Pangkalahatang operasyon2372220
Pangkalahatang Surgeon27893
Pangkalahatang Psychiatry336
Pangkalahatang gamot30327
Data ng Medikal na Audio ayon sa Device
SpecialityMga Audio File ng Pasyente (Playtime sa Oras)Kabuuang Bilang ng Mga Audio File

total

257,9775,172,766
iPhone66632,382
Digital recorder1,65922,377
Mixed type 69,8181,408,679
smartPhone51,5331,306,405
SpeechMic10,329257,730
Pagdidikta sa Telepono120,8672,071,557
Hindi kilala3,10473,636

Nakikitungo kami sa lahat ng uri ng Data Licensing ie, text, audio, video, o imahe. Ang mga dataset ay binubuo ng mga Medikal na dataset para sa ML: Physician Dictation Dataset, Physician Clinical Notes, Medical Conversation Dataset, Medical Transcription Dataset, Doctor-Patient Conversation, Medical Text Data, Medical Images - CT Scan, MRI, Ultra Sound (collected basis custom requirements) .

Shaip makipag-ugnayan sa amin

Hindi mahanap ang iyong hinahanap?

Ang mga bagong off-the-shelf na medikal na dataset ay kinokolekta sa lahat ng uri ng data 

Makipag-ugnayan sa amin ngayon para mawala ang iyong mga alalahanin sa pangongolekta ng data sa pagsasanay sa pangangalagang pangkalusugan

  • Sa pagrerehistro, sumasang-ayon ako kay Shaip Pribadong Patakaran at Mga palatuntunan at ibigay ang aking pahintulot na makatanggap ng komunikasyon sa marketing ng B2B mula sa Shaip.

Binubuo ang audio data ng pagdidikta ng doktor ng mga audio file kung saan inilalarawan ng mga doktor ang klinikal na kondisyon, plano ng paggamot, o kasaysayan ng medikal ng pasyente sa panahon ng mga konsultasyon o pagbisita sa ospital.

Ang data na ito ay mahalaga para sa pagsasanay ng mga modelo ng AI sa speech recognition, natural language processing (NLP), at clinical documentation automation. Nakakatulong itong bumuo ng mga system para sa pag-transcribe, pagsusuri, at pagpapabuti ng mga workflow ng dokumentasyon ng pangangalagang pangkalusugan.

Kasama sa dataset ang 257,977 oras ng pagdidikta ng doktor sa totoong mundo mula sa 31 medikal na specialty. Nire-record ang audio gamit ang iba't ibang device, kabilang ang mga telepono, digital recorder, smartphone, at speech microphone.

Oo, ang lahat ng mga audio file ay na-de-identify upang alisin ang Personally Identifiable Information (PII), na tinitiyak ang pagiging kumpidensyal ng pasyente.

Oo, ang mga dataset ay sumusunod sa HIPAA at Safe Harbor Guidelines, kasama ng iba pang pandaigdigang pamantayan sa privacy.

Oo, ang mga dataset ay maaaring iayon sa mga partikular na specialty, demograpiko, o mga uri ng device sa pagre-record batay sa mga kinakailangan ng proyekto.

Talagang. Malawak ang mga dataset, na may milyun-milyong audio file, na ginagawang angkop ang mga ito para sa parehong maliit at malakihang AI/ML na proyekto.

Ang data ng medikal na audio at mga kaukulang transcript ay ibinibigay sa mga karaniwang format na maaaring isama nang walang putol sa mga modelo ng pagkilala sa pagsasalita at natural na pagpoproseso ng wika (NLP).

Ang data ng audio ay sumasailalim sa mahigpit na pagsusuri sa kalidad, at ang mga eksperto sa domain ay nagpapatunay ng mga anotasyon upang matiyak ang katumpakan at pagiging maaasahan.

Ang gastos ay depende sa mga salik gaya ng dami ng data, pagpapasadya, at saklaw ng proyekto. Hinihiling namin na punan mo ang form na "Makipag-ugnay sa Amin" ng iyong mga kinakailangan upang matanggap ang pinakamahusay na quote.

Nag-iiba-iba ang mga timeline ng paghahatid batay sa laki at pagiging kumplikado ng proyekto, ngunit nakabalangkas upang matugunan ang mga deadline nang mahusay.

Pinapahusay ng mga dataset na ito ang mga kakayahan ng AI sa pag-automate ng klinikal na dokumentasyon, pagpapabuti ng katumpakan ng transkripsyon, at pagpapagana ng mas mahusay na paggawa ng desisyon para sa mga provider ng pangangalagang pangkalusugan.