Research assistant wanted for a project dealing with the creation of online digital corpora. Applicants must have working knowledge of Python and experience working with HTML, PDF and TXT files. The work involves web scraping, converting between different file formats, text cleaning and preparing files to be uploaded to the project website. Background in International Relations or natural language processing is an advantage. For more details, please contact Efrat Miller – efrat.miller@mail.huji.ac.il
לפרויקט יצירה של קורפוסים ממוחשבים דרוש.ה עוזר.ת מחקר עם יידע בפייתון ונסיון בעבודה עם קבצי HTML, PDF ו-TXT. עיקר העבודה – הורדה של מסמכים מהאינטרנט, המרה בין פורמטים, ניקוי קבצי טקסט והכנה להעלאה לאתר הפרויקט. יתרון לרקע ביחב”ל ועיבוד שפות טבעיות. לפרטים נוספים והגשת מועמדות אנא פנו לאפרת מילר