update publication, fix job description, add summer internship

maum-ai · Jun 17, 2024 · 3b8902c · 3b8902c
1 parent a98e508
commit 3b8902c
Show file tree

Hide file tree

Showing 7 changed files with 212 additions and 11 deletions.
diff --git a/docusaurus.config.js b/docusaurus.config.js
@@ -98,6 +98,11 @@ const config = {
             label: 'Careers',
             position: 'right',
           },
+          {
+            href: '/internship',
+            label: 'Internship',
+            position: 'right',
+          },
           {
             href: 'https://github.com/maum-ai',
             label: 'GitHub',

diff --git a/src/pages/careers.mdx b/src/pages/careers.mdx
@@ -11,6 +11,7 @@ import TabItem from '@theme/TabItem';
 
 import figAlgoSession from './image/algo-session.jpg';
 import figBrainRoom from './image/brain-room.png';
+import figHome from './image/maum-home.png';
 
 # maum.ai Brain팀에 지원하세요!
 
@@ -116,39 +117,44 @@ import figBrainRoom from './image/brain-room.png';
 
 <br/>
 
-
 ### 근무 형태
 
 Brain팀은 시차출퇴근제를 진행하고 있습니다.  
 **코어타임은 10시 30분부터 17시까지**로, 오전 8시 ~ 오전 10시 30분 사이에 각자가 정한 시간에 출근합니다.  
 **산업기능요원, 전문연구요원으로 복무하시는 분들도 시차출퇴근제 적용이 가능**합니다!
 
+병역이 아니신 정규직 분들은 재택과 병행하여 하이브리드 근무가 가능합니다. 😉
+
 <br/>
 
 ### 근무 환경
 
-Brain팀 구성원에게는 **입사 시 GPU 탑재 데스크탑부터 MacBook까지 원하는 기기를 지원**해드리며, **모니터 및 모니터암을 기본으로 제공**하여 Brain팀 구성원분들의 목 건강도 책임집니다!  
+Brain팀 구성원에게는 **입사 시 GPU 탑재 데스크탑부터 MacBook까지 원하는 기기를 지원**해드리며, **모니터 및 모니터암을 기본으로 제공**하여 Brain팀 구성원분들의 목 건강도 책임집니다! 💪
 
-Brain팀에는 **연구용으로만 On-premise로 V100 10대, A100 30대, H100 10대 이상을 운용**하고 있고, 인원당 On-premise GPU를 최소 2대 이상 사용하실 수 있게끔 연구 및 개발환경을 구축하고 있습니다. (2023년 07월 기준)
+Brain팀에는 **연구용으로만 On-premise로 V100 10대, A100 30대, H100 64대 이상을 운용**하고 있고, 인원당 On-premise GPU를 최소 2대 이상 사용하실 수 있게끔 연구 및 개발환경을 구축하고 있습니다. (2024년 06월 기준)
 
 <img className={styles.figCenter} src={figBrainRoom} alt="brain-room" />
 
 <br/>
 
 Brain팀 AI Scientist는 회사의 사업 방향에 따른 연구인 **Strategic Research**와 개인 관심 주제에 따른 자유 연구인 **General Research**를 **일과 중 절반씩 진행**하는 것을 권장하는 등 최적의 연구 환경을 마련해드리기 위해 노력하고 있습니다. 
 
-**NeurIPS, ICLR, CVPR, ECCV, Interspeech, ACL 등 학회 참석 및 학회 논문 제출**을 희망하실 경우, 적극적으로 지원해드리고 있습니다! (현재까지 채택된 논문 현황에 대해서는 **[Publications](/publications)** 탭을 참고해주세요!)  
+**NeurIPS, ICLR, CVPR, ECCV, Interspeech, ACL 등 학회 참석 및 학회 논문 제출**을 희망하실 경우, 적극적으로 지원해드리고 있습니다! 💸 (현재까지 채택된 논문 현황에 대해서는 **[Publications](/publications)** 탭을 참고해주세요!)  
 <br/>
 
-maum.ai는 전 직원 **점심 식사 식대를 제공**합니다. 판교 사옥 근처의 많은 식당을 자유롭게 이용할 수 있습니다!
+<img className={styles.figCenter} src={figHome} alt="home" />
+
+maum.ai는 전 직원 **점심 식사 식대를 제공**합니다.(1일 16000원) 판교 사옥 근처의 많은 식당을 자유롭게 이용할 수 있습니다!
+
+또한 사옥 내에도 로봇 바리스타가 비치되어 있어 자유롭게 음료 음용이 가능합니다. 🍹
 
 
 
 <br/>
 
 ### 처우
 
-maum.ai Brain팀의 AI Scientist / ML Engineer 로 함께 하시게 될 경우, Brain팀과의 Fit이 맞는 지 확인하는 기간으로 **3개월의 수습 기간**을 갖습니다. (학위 및 경력 무관) 
+maum.ai Brain팀의 AI Scientist / ML Engineer 로 함께 하시게 될 경우, Brain팀과의 Fit이 맞는 지 확인하는 기간으로 **3개월의 수습 기간**을 갖습니다. (학위 및 경력 무관) 🧑‍💻
 
 이후 수습 기간 중 보여주신 역량에 따라 평가를 진행하며, Brain팀 정식 구성원으로서 **최소 5,000만원의 연봉**으로 처우를 결정합니다 (석사의 경우 **최소 5,500만원**).
 
@@ -158,12 +164,12 @@ maum.ai Brain팀의 AI Scientist / ML Engineer 로 함께 하시게 될 경우,
 
 ### 사무실 위치
 
-maum.ai Brain팀에서 함께 하시게 될 경우, **판교 본사 오피스 및 연구소**에서 근무하시게 됩니다.
+maum.ai Brain팀에서 함께 하시게 될 경우, **판교 본사 오피스 및 연구소**에서 근무하시게 됩니다. (*재택근무는 집에서 😎)
 
-maum.ai 판교 본사 오피스는 **판교IT센터 4층**에 위치하고 있습니다. (구글 지도에 아직 업데이트 되지 않아서 아래 지도는 앞 건물입니다)
+maum.ai 판교 본사 오피스는 **판교IT센터 4층**에 위치하고 있습니다.
 
 <div className={styles.mapResponsive}>
-<iframe className={styles.googleMap} src="https://www.google.com/maps/embed?pb=!1m18!1m12!1m3!1d3169.06967057869!2d127.08936028182508!3d37.41182811281841!2m3!1f0!2f0!3f0!3m2!1i1024!2i768!4f13.1!3m3!1m2!1s0x357ca7c7e7677691%3A0x2c4282e124e93f95!2zTEgg7YyQ6rWQ7KCcMu2FjO2BrOuFuOuwuOumrCDquLDsl4XshLHsnqXshLzthLA!5e0!3m2!1sen!2skr!4v1691572468680!5m2!1sen!2skr" width="600" height="450" allowfullscreen="" loading="lazy" referrerpolicy="no-referrer-when-downgrade"></iframe>
+<iframe className={styles.googleMap} src="https://www.google.com/maps/embed?pb=!1m18!1m12!1m3!1d3169.0726295115574!2d127.09005017586666!3d37.411758172079104!2m3!1f0!2f0!3f0!3m2!1i1024!2i768!4f13.1!3m3!1m2!1s0x357ca75847776f07%3A0x7739a77102bd032!2zKOyjvCnrp4jsnYzsl5DsnbTslYTsnbQ!5e0!3m2!1sko!2skr!4v1718269729881!5m2!1sko!2skr" width="600" height="450" allowfullscreen="" loading="lazy" referrerpolicy="no-referrer-when-downgrade"></iframe>
 </div>
 
 <br/>

diff --git a/src/pages/image/h100-gpu.png b/src/pages/image/h100-gpu.png
diff --git a/src/pages/image/maum-home.png b/src/pages/image/maum-home.png
diff --git a/src/pages/image/maumai_intern_banner.png b/src/pages/image/maumai_intern_banner.png
diff --git a/src/pages/internship.mdx b/src/pages/internship.mdx
@@ -0,0 +1,183 @@
+---
+title: maum.ai Brain팀 채용
+description: maum.ai Brain팀에 지원하세요!
+image: img/maumai_Symbol.png
+---
+
+import Link from '@docusaurus/Link';
+import styles from './index.module.css';
+import Tabs from '@theme/Tabs';
+import TabItem from '@theme/TabItem';
+
+import figinternbanner from './image/maumai_intern_banner.png';
+import figAlgoSession from './image/algo-session.jpg';
+import figBrainRoom from './image/brain-room.png';
+import figHome from './image/maum-home.png';
+import figGPU from './image/h100-gpu.png';
+
+<img className={styles.figCenter} src={figinternbanner} alt="internbanner" />
+
+# maum.ai Brain팀 체험형 인턴에 지원하세요!
+
+마음에이아이 브레인 팀에서 체험형 인턴을 채용합니다. 최소 2달 안에 성과가 날 수 있고, 현업과 밀접하게 맞닿아있는 프로젝트를 진행할 수 있도록 구성하여 3가지의 Track을 선정했으며, 지원자는 3가지의 Track중 관심 있는 주제 하나를 선택해서 수행합니다.
+
+회사에서 주어지는 풍부한 자원을 활용하여 프로젝트를 진행하고, 최종 결과물을 발표하게 됩니다. 또한, 프로젝트 진행 중에는 Brain팀의 다양한 멤버들과 함께 협업하며, 실무 경험을 쌓을 수 있습니다. 😎
+
+<div className={styles.buttons}>
+    <Link
+        className="button button--primary button--lg"
+        color="red"
+        to="https://forms.gle/SeN29RkfpU1TsR3q9">
+        Brain팀 체험형 인턴 지원하기✍
+    </Link>
+</div>
+
+---
+
+## Track 1: Autonomous LLM Agent for Real-world Problem Solving
+
+> Autonomous LLM Agent는 현실의 문제를 해결하기 위하여 self desicion-making이 가능한 LLM application을 의미합니다.<br/>
+> [더 자세히 알아보기](https://huggingface.co/docs/transformers/agents)
+
+##### 주요 업무
+- autonomous LLM Agent application 개발 🤖
+- autonomous LLM Agent 성능 향상을 위한 실험 설계 및 구현 👾
+- Baseline Model 학습
+##### 연구 방향
+현재 Large Language Models (LLM)은 강력한 언어 처리 능력을 갖추고 있지만, 실제 의사결정 작업에서는 몇 가지 한계가 있습니다. 예를 들어, LLM은 복잡한 실제 문제를 해결할 때 유연성과 실효성이 부족합니다. 이러한 한계를 극복하기 위해, LLM이 스스로 의사 결정을 하고, 주어진 과제를 수행할 수 있도록 하는 것은 NLP 연구에 있어 중요한 도전 과제가 되었습니다. 저희의 궁극적인 목표는 다양한 현실의 문제를 유연하게 해결할 수 있는 End-to-End Autonomous Agent를 구현하는 것입니다.
+##### What You Will Do
+- Autonomous LLM Agent 관련 기술 동향 파악
+- Autonomous LLM Agent 학습을 위한 방법론 설계 및 구현
+- 모델 학습 및 성능 평가
+
+---
+
+## Track 2: Domain Adaptation for Large Language Model Research & Development
+
+> Domain-Specific LLM은 의료 AI, 금융 AI 등과 같이 특정 분야(Domain)에 특화된 LLM을 의미합니다.<br/>
+> [더 자세히 알아보기](https://www.larksuite.com/en_us/topics/ai-glossary/domain-specific-language-models)
+
+##### 주요 업무
+- 금융, 의료, 교육, 법학 등 도메인 학습 데이터 구축 📜
+- 도메인 특화 LLM 성능 향상을 위한 실험 설계 및 구현 🤔
+- Baseline Model 학습
+##### 연구 방향
+Large Language Models (LLMs)는 자연어 처리 분야에서 일반적인 작업에 대해 높은 성능을 보이고 있지만, 특정 도메인(예: 의료, 금융)에서는 아직 전문가 수준에 도달하지 못했습니다. 최근의 연구는 특정 도메인에서의 성능 향상을 통해 모델을 도메인 전문가로 만드는 필요성을 강조하고 있습니다. 그러나 모델이 기존의 능력을 유지하면서 새로운 도메인 지식을 효과적으로 습득하는 것은 중요한 도전 과제입니다. 이를 위해, 다양한 산업 분야에 적용 가능한 LLM을 개발하고자 Domain Adaptation Approach를 연구하며, 각 대상 도메인에 맞춤화된 전문가 수준의 언어 모델을 구축하고자 합니다.
+##### What You Will Do
+- Domain Adaptation 관련 기술 동향 파악
+- Domain Adaptation을 위한 학습 방법론 설계 및 구현
+- 추가 학습 데이터세트 구축
+- 모델 학습 및 성능 평가
+
+> ###### Reference
+> [Simple and Scalable Strategies to Continually Pre-train Large Language Models](https://openreview.net/forum?id=DimPeeCxKO)<br/>
+> [Injecting New Knowledge into Large Language Models via Supervised Fine-Tuning](https://arxiv.org/pdf/2404.00213)
+
+---
+
+## Track 3: Large Language Model that understands Vision and Korean
+
+> 한국어 및 시각 정보를 이해하는 LLM을 개발합니다.
+
+##### 주요 업무
+- 한국어 & 이미지 데이터 수집 및 전처리 📰
+- baseline 모델 학습 및 성능 향상을 위한 실험 설계 및 구현 🔍
+- 한국어 LLM, VLM 학습
+##### 연구 방향
+최근 LLM 커뮤니티는 gpt를 뛰어넘는 성능의 모델이 오픈소스로 나오며 비약적인 발전을 보이고 있습니다. 하지만 이건 영어에 한정되어 있고, 한국어를 다루는 LLM과 VLM은 성능이 좋지 않거나 발전이 더디며, 학습 데이터도 부족합니다. 이를 보완하기 위해, 최신 연구를 follow-up 하며 한국어 데이터와 이미지 데이터를 활용한 멀티모달 한국어 LLM을 개발하고자 합니다. 이를 통해 한국어 및 시각 정보를 이해하는 LLM을 개발하고, 다양한 task에 적용하여 성능을 평가하고자 합니다.
+##### What You Will Do
+- 한국어 데이터, 이미지가 포함된 데이터 수집 및 전처리
+- Continual Instruction Tuning을 통한 한국어 학습
+- 한국어 Vision Language model 실험 설계 및 구현
+
+> ###### Reference
+> [FineWeb: decanting the web for the finest text data at scale](https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1)<br/>
+> [Efficient and Effective Vocabulary Expansion Towards Multilingual Large Language Models](https://arxiv.org/abs/2402.14714)<br/>
+> [Improved Baselines with Visual Instruction Tuning](https://arxiv.org/abs/2310.03744)<br/>
+> [X-LLaVA: Optimizing Bilingual Large Vision-Language Alignment](https://arxiv.org/pdf/2403.11399)
+
+---
+
+## 지원 상세
+
+### 필요한 역량
+
+- Large Language Model에 대한 관심 및 프로젝트 경험
+- AI 관련 기술 논문을 읽고 내용을 충분히 이해하는데 무리가 없는 수준의 영어 능력
+- PyTorch 등 ML/DL framework 활용 및 모델 구현에 자유로울 수 있는 수준의 개발 능력
+
+### 우대 요건
+
+- Kaggle, Dacon과 같은 AI/ML 관련 대회 수상 경험
+- ML/DL 알고리즘을 깊이 이해할 수 있는 수준의 수학적 능력 및 모델링 능력
+- ML/DL 연구 논문 Implementation 또는 관련 Repository의 Contribution 경험
+
+### 제출 서류
+
+- 이력서 (필수)
+- 포트폴리오 URL (선택사항)
+
+### 전형 절차
+
+- 서류 접수 기간: 6월 17일 ~ 6월 23일 (23:59까지)
+- 전형 절차: 서류 전형 → 기술진 면접(화상) → 최종 합격자 발표
+
+전형절차는 변동될 수 있으며, 기술진 면접 결과에 따라 임원진 면접 절차가 추가될 수 있습니다.<br/>
+서류 합/불 여부는 모든 지원자에게 6월 24일경 발송될 예정입니다.
+
+## 지원 기타
+
+- 해당 전형은 방학 기간 체험형 인턴으로 진행되며, 복학 여부, 평과 결과에 따라 계약 연장을 검토할 수 있습니다.
+- 문의 사항이 있을 경우, [email protected] 로 문의주시면 최대한 빠르게 답변드릴 수 있도록 하겠습니다.
+
+<br/><br/>
+
+## 근무 환경 및 복지
+
+<br/>
+
+<img className={styles.figCenter} src={figAlgoSession} alt="algo-session" />
+
+<br/>
+
+
+### 근무 형태
+
+Brain팀은 시차출퇴근제를 진행하고 있습니다.
+**코어타임은 10시 30분부터 17시까지**로, 오전 8시 ~ 오전 10시 30분 사이에 각자가 정한 시간에 출근합니다.
+
+업무 중 보여주시는 퍼포먼스에 따라서 주 1회 재택근무도 실시할 예정입니다. 😉
+
+<br/>
+
+### 근무 환경
+
+Brain팀 구성원에게는 **입사 시 GPU 탑재 데스크탑부터 MacBook까지 원하는 기기를 지원**해드리며, **모니터 및 모니터암을 기본으로 제공**하여 Brain팀 구성원분들의 목 건강도 책임집니다! 💪
+
+<img className={styles.figCenter} src={figGPU} alt="gpu" />
+
+Brain팀에는 **연구용으로만 On-premise로 V100 10대, A100 30대, H100 64대 이상을 운용**하고 있고, 인원당 On-premise GPU를 최소 2대 이상 사용하실 수 있게끔 연구 및 개발환경을 구축하고 있습니다. (2024년 06월 기준)
+
+<img className={styles.figCenter} src={figHome} alt="home" />
+
+maum.ai는 전 직원 **점심 식사 식대를 제공**합니다.(1일 16000원) 판교 사옥 근처의 많은 식당을 자유롭게 이용할 수 있습니다!
+
+또한 사옥 내에도 로봇 바리스타가 비치되어 있어 자유롭게 음료 음용이 가능합니다. 🍹
+
+<br/>
+
+### 사무실 위치
+
+maum.ai Brain팀에서 함께 하시게 될 경우, **판교 본사 오피스 및 연구소**에서 근무하시게 됩니다.
+
+maum.ai 판교 본사 오피스는 **판교IT센터 4층**에 위치하고 있습니다.
+
+<div className={styles.mapResponsive}>
+<iframe className={styles.googleMap} src="https://www.google.com/maps/embed?pb=!1m18!1m12!1m3!1d3169.0726295115574!2d127.09005017586666!3d37.411758172079104!2m3!1f0!2f0!3f0!3m2!1i1024!2i768!4f13.1!3m3!1m2!1s0x357ca75847776f07%3A0x7739a77102bd032!2zKOyjvCnrp4jsnYzsl5DsnbTslYTsnbQ!5e0!3m2!1sko!2skr!4v1718269729881!5m2!1sko!2skr" width="600" height="450" allowfullscreen="" loading="lazy" referrerpolicy="no-referrer-when-downgrade"></iframe>
+</div>
+
+<br/>
+
+#### 오시는 길
+
+판교역 2번 출구 '판교역동편' 정류장에서 55, 310 등 시내버스 탑승 후 '기업성장센터' 정류장에서 하차하시면 됩니다. 버스로 15분 가량 소요됩니다.
diff --git a/src/pages/publications.mdx b/src/pages/publications.mdx
@@ -14,9 +14,16 @@ import * as features from '@site/src/components/PublicationFeatures';
 ### 2024
 <section id="activities" className={styles.category}>
     <ul className={styles.publications}>
-    <li>
+        <li>
+            <features.ConferenceItem conference="Interspeech"/>
+            <features.PaperTitle paperLink="https://arxiv.org/abs/2406.06111" title="JenGAN: Stacked Shifted Filters in GAN-Based Speech Synthesis"/>
+            <features.AuthorItem authors={["Hyunjae Cho", "Junhyeok Lee", "Wonbin Jung"]} numFirstAuthor={1} isBrainTeam={[true, true, true]}/>
+            <features.PaperDescription preview="Non-autoregressive GAN-based neural vocoders are widely used due to their fast inference speed and high perceptual quality. "
+            description="However, they often suffer from audible artifacts such as tonal artifacts in their generated results. Therefore, we propose JenGAN, a new training strategy that involves stacking shifted low-pass filters to ensure the shift-equivariant property. This method helps prevent aliasing and reduce artifacts while preserving the model structure used during inference. In our experimental evaluation, JenGAN consistently enhances the performance of vocoder models, yielding significantly superior scores across the majority of evaluation metrics."/>
+        </li>
+        <li>
             <features.ConferenceItem conference="ICASSP"/>
-            <features.PaperTitle paperLink="https://arxiv.org/abs/2211.04610" title="EnCLAP: Combining Neural Audio Codec and Audio-Text Joint Embedding for Automated Audio Captioning"/>
+            <features.PaperTitle paperLink="https://arxiv.org/abs/2401.17690" title="EnCLAP: Combining Neural Audio Codec and Audio-Text Joint Embedding for Automated Audio Captioning"/>
             <features.AuthorItem authors={["Jaeyeon Kim", "Jaeyoon Jung", "Jinjoo Lee", "Sang Hoon Woo"]} numFirstAuthor={1} isBrainTeam={[true, true, true, false]}/>
             <features.PaperDescription preview="We propose EnCLAP, a novel framework for automated audio captioning. "
             description="EnCLAP employs two acoustic representation models, EnCodec and CLAP, along with a pretrained language model, BART. We also introduce a new training objective called masked codec modeling that improves acoustic awareness of the pretrained language model. Experimental results on AudioCaps and Clotho demonstrate that our model surpasses the performance of baseline models. Source code will be available at https://github.com/jaeyeonkim99/EnCLAP. An online demo is available at https://huggingface.co/spaces/enclap-team/enclap."/>