Store Sales - Time Series Forecasting : Frequently Asked Questions
매장 매출 - 시계열 예측 : 자주 묻는 질문들
What is a Getting Started competion?
Getting Started 대회란 무엇인가?
Getting Started competions were created by Kaggle data scientists for people who have little to no machine learning background. They are a great place to begin if you are new to data science or just finished a MOOC and want to get involved in Kaggle.
Getting Started 대회란 머신러닝에 대한 경험이 거의 없거나 전혀 없는 사람들을 위해 Kaggle 데이터 과학자들이 많든 대회입니다. 데이터 과학에 처음 접하는 경우나 MOOC를 완료한 후 Kaggle에 참여하고자 하는 경우에 시작하기 좋습니다.
- involved: 관여하는, 연루된, 가까운 사이인
Getting Started competitions are a non-competitive way to get familiar with Kaggle’s platform, learn basic machine learning concepts, and start meeting people in the community. They have no cash prize and are on a rolling timeline.
Getting Started 대회는 Kaggle 플랫폼에 익숙해지는 데 도움이 되며, 기본적인 머신러닝 개념을 학습하고 커뮤니티 사람들과 소통을 시작하기 좋습니다. 이 대회엔 상금이 없으며, 일정은 지속적으로 진행됩니다.
- familiar: 친숙한, 익숙한
What’s the difference between a private and public leaderboard?
private leaderboard와 public leaderboard의 차이는 무엇인가요?
In this competition, because it is a Getting Started competition, there is no difference. We’re scoring the entire test set on the Public Leaderboard. And we will refresh the competition every three months, so the Private Leaderboard is irrelevant.
이 대회에서 둘의 차이는 없습니다. 우리는 Public leaderboard에 있는 모든 test set에 점수를 매기고 있습니다. 그리고 대회는 3개월마다 업데이트하고, Private leaderboard와 관련이 없습니다.
- refresh: 생기를 되찾게 하다, 다시 채우다
- irrelevant: 무관한, 상관없는
For non-Getting Started Kaggle competitions, there is the concept of a public and private leaderboard to prevent participants from “overfitting” to the leaderboard. If your model is “overfit” to a dataset then it is not generalizable outside of the dataset you trained it on. This means that your model would have low accuracy on another sample of data taken from a similar dataset.
하지만 Getting Started 대회 이외에 Kaggle 대회에서는 참가자들이 leaderboard에 “과적합”되는 것을 방지하기 위해 public과 private leaderboard 개념이 있습니다. 만약 모델이 데이터셋에 “과적합”이 된 경우, 그 모델을 학습한 데이터 셋 이외엔 일반화할 수 없습니다. 이 의미는 모델이 유사한 데이터셋에서 가져온 다른 데이터 샘플에서도 낮은 정확도를 가질 것을 의미합니다.
- participants: 참가자
- overfit: 과다 적합
- generalizable: 일반화 할 수 있는
- similar: 비슷한
How do i create and manage a team?
팀을 생성하고 관리하는 방법은 무엇인가요?
When you accept the competition rules, a team will be created for you. You can invite others to your team, accept a merger with another team, and update basic information like team name by going to the Team page.
대회 규칙을 수락하면 자동으로 팀이 생성됩니다. 팀 페이지에서 다른 사람을 초대하거나 다른 팀과 합병을 수락할 수 있고, 팀 이름과 같은 기본 정보를 업데이트할 수 있습니다.
We’ve heard from many Kagglers that teaming up is the best way to learn new skills AND have fun. If you don’t have a teammate already, consider asking if anyone wants to team up in the discussion forum.
많은 Kaggler들이 함께 일하면서 새로운 기술을 배우고 즐기는 것이 최고의 방법이라고 이야기하고 있습니다. 팀 파트너가 없는 경우, 토론 포럼에서 함께 팀을 구성하고자 하는 사람들에게 문의해보시기 바랍니다.
- teammate: 팀 동료
- discussion: 논의, 상의
- forum: 포럼, 토론의 장, 토론회
What are Notebooks?
Notebooks이란 무엇인가요?
Kaggle Notebooks is a cloud computational environment that enables reproducible and collaborative analysis. Kernels supports scripts in R and Python, Jupyter Notebooks, and RMarkdown reports. Go to the Notebooks tab to view all of the publicly shared code on this competition. For more on how to use Notebooks to learn data science, visit Kaggle’s Learn Courses.
Kaggle Notebooks는 재현 가능하고 협업적인 분석이 가능한 클라우드 컴퓨팅 환경입니다. 커널은 R 및 Python 스크립트, Jupyter 노트북 및 R 마크다운 보고서를 지원합니다. 노트북 탭으로 이동하여 이 대회에서 공개된 모든 코드를 볼 수 있습니다. 데이터 과학을 배우는 데 노트북을 사용하는 방법에 대해선 Kaggle Learn Courses를 방문해보세요.
- cloud: 클라우드, 온라인 저장 서비스
- computational: 컴퓨터를 사용한, 컴퓨터의
- reproducible: 재생할 수 있는, 재현할 수 있는, 복사할 수 있는
- collaborative: 공동의
How do i make a submission?
어떻게 제출하나요?
In this code competition, your submission.csv file must be generated as an output from a Kaggle notebook. To submit from a notebook, you should:
- “Commit” / “Save & Run” a notebook that generates a submission.csv containing your predictions in the correct format (requirements described above).
- Go to the “Output” section of the notebook in viewer mode.
- The submission.csv can then be submitted to the competition via the “Submit to Competition” button.
이 코드 대회에선 Kaggle 노트북에서 생성된 submission.csv 파일을 제출해야 합니다. 노트북에서 제출하는 방법은 다음과 같습니다:
- 예측을 포함한 올바른 형식의 submission.csv 파일을 생성하는 노트북을 “Commit” / “ Save & Run”합니다. (위의 요구 사항 참조).
- 노트북의 “Output”으로 이동하여 뷰어 모드에서 확인합니다.
- submission.csv는 “Submit to Competition” 버튼을 통해 대회에 제출할 수 있습니다.
- via: 경유하여, 통하여
This is not a code competition with a hidden test set. And there is no private leaderboard. Therefore, your code will not bo re-run on a private test set, and the test set provided on the Data page is the full set of observations for which your submission.csv must make predictions.
이 대회는 숨겨진 테스트 셋을 사용하지 않는 코드 대회입니다. 또한 private leaderboard가 없습니다. 따라서 코드가 private test set에서 다시 실행되지 않으며, 데이터 페이지에서 제공되는 테스트 셋이 submission.csv로 예측해야 하는 모든 관측치의 셋입니다.
Why did my team disappear from the leaderboard?
왜 우리 팀이 leaderboard에서 사라졌습니까?
To keep with the spirit of getting-started competitions, we have implemented a three month rolling window on submissions. Once a submission is more than three months old, it will be invalidated and no longer count towards the leaderboard.
초보자 대회의 정신을 유지하기 위해 제출물에 대해 3개월 롤링 윈도우를 적용했습니다. 즉, 제출물이 3개월 이상된 경우 더 이상 leaderboard에 포함되지 않으며 점수로 인정되지 않습니다.
- implement: 시행하다, 도구
- invalidated: 무효화하다.
If your team has no submissions in the previous three months, the team will also drop from the leaderboard. This will keep the leaderboard at a manageable size, freshen it up, and prevent newcomers from getting lost in a sea of abandoned scores.
팀이 지난 3개월 동안 제출물이 없는 경우, 팀도 leaderboard에서 삭제됩니다. 이는 leaderboard를 관리 가능한 크기를 유지하고, 새로운 참가자들이 포기한 점수들 사이에 묻히는 것을 막기 위함입니다.
- freshen: 상쾌하게 하다
- abandoned: 버려진, 유기된
“I worked so hard to get that score! Give it back!” Read more about our decision to implement rolling leaderboards, covered in the Titanic Getting Started Competition forum here.
“나는 그 점수를 얻기 위해 열심히 노력했습니다. 돌려주세요!” 자세한 내용은 Titanic Getting Started 대회 포럼에서 롤링 리더보드 도입 결정에 대한 정보를 확인하실 수 있습니다.
How do i contact Support?
지원팀에 어떻게 연락합니까?
Kaggle does not have a dedicated support team so you’ll typically find that you receive a response more quickly by asking your question in the appropriate forum. (For this competition, you’ll want to use this competition’s discussion forum.)
Kaggle은 전용 지원팀이 없으므로, 문제를 해결하기 위해선 적절한 포럼에서 질문을 하면 빠르게 답변을 받을 수 있습니다. (이 대회의 경우, 이 대회의 토론 포럼을 사용하시면 됩니다.)
- dedicated: 전념하는, 헌신적인, 전용의
- typically: 보통, 일반적으로, 전형적으로
- appropriate: 적절한
Support is only able to help with issues that are being experienced by all participants. Before contacting support, please check the discussion forum for information on your problem. If you can’t find it, you can pose your problem in the forum so a fellow participant or a Kaggle team member can provide help. The forums are full of useful information on the data, metric, and different approaches. We encourage you to use the forums often. If you share your knowledge, you’ll find that others will share a lot in turn!
지원팀은 모든 참가자가 겪는 문제에 대해서만 도움을 제공할 수 있습니다. 지원팀에 문의하기 전에, 귀하의 문제에 대한 정보를 토론 포럼에서 확인해보시기 바랍니다. 만약 찾을 수 없다면 포럼에 귀하의 문제를 게시하여 다른 참가자나 Kaggle 팀원이 도움을 제공할 수 있도록 하길 바랍니다. 포럼에는 데이터, 메트릭, 다양한 접근 방식에 대한 유용한 정보가 가득합니다. 자주 포럼을 이용하시길 바랍니다. 지식을 공유하면, 다른 사람들도 많은 것을 나누어 줄 것입니다!
If your problem presists or it seems to be effective all participants then please contact us.
만약 귀하의 문제가 계속해서 발생하거나 모든 참가자에게 영향을 미치는 것으로 보인다면 지원팀에 문의해주세요.
댓글남기기